「メタデータ」を含む日記

2025-05-08

■ChatGPT、だいぶ信用できないな

油淋鶏について調べてたら論文が出てきたからそのPDFを食わせて要約を頼んだんだけど

https://www.jstage.jst.go.jp/article/kjoho/2/1/2_3/_pdf

その結果がこちら

この文書は「第二部第三章　近代国家の形成と市民生活」に関する学習資料です。以下のようなポイントが中心です：
　
1. 近代国家の形成
主権国家の成立
近代国家は、絶対王政や啓蒙専制などの支配体制を経て形成された。ルイ14世のような王権神授説による支配がその例。
　
国民国家の登場
フランス革命やアメリカ独立革命を通じて、国民が主権を持つ「国民国家」の考えが広まった。
憲法・議会・国民軍などの制度が整備された。
　
2. 産業革命と市民社会
イギリスから始まった産業革命
機械化・工場制生産により都市化が進行し、資本家と労働者という階級が形成された。
　
市民革命と市民階級
経済力を持った市民が政治参加を求め、参政権拡大や社会改革を推進した。
一方、労働者は劣悪な労働条件や貧困に直面し、労働運動や社会主義思想が発展。
　
3. 国民統合と教育・軍事
義務教育と徴兵制
国民統合の手段として義務教育や徴兵制が導入され、国家意識を高めた。
読み書き・歴史教育により国民としての自覚を育成。
　
4. 国家と個人の関係
国家の干渉と個人の自由
自由主義思想に基づく国家への制限（法の支配）が求められた。
しかし、戦争や社会保障の必要から国家の介入も拡大。
　
この資料は、近代国家がどのようにして誕生し、社会や市民の生活がどう変わったかを学ぶためのものです。

は？

食わせたPDFにはイチミリもそんなこと書いてないよね？

油淋鶏の由来と謎しか書いてないよね？

その後、タイトルを復唱させてから再度要約させたらちゃんとした内容が出てきたんだけど

最初になんで食わせたファイルの内容と全く関係ない内容を出してきたのかマジでわからん

AIがそんなことをする意味が分からんというか

まだ文書の要約の仕方が適切ではないとかならわかるけど、全く関係ない内容出す意味が分からん

そもそもその内容はどこからとってきたんだよ

追記：本人に聞いてみた。

① ユーザーがPDFをアップロード
→ 直後に「要約お願い！」という非常に一般的かつ短い指示。
　
② PDFの中身を分析する前に、旧い“メタデータ予測”が働いた可能性
→ ファイル名が 2_3.pdf だったため、これを
「教科書の第2部第3章」＝「近代国家の形成と市民生活」と誤って類推した可能性があります。
これは、文脈なしで「2_3」という文字列を見たときのありがちな学校教材パターンを言語モデルが勝手に予測したものです。
　
③ 実際のPDFを読む前に、その予測をベースに回答してしまった
→ 本来なら内容を読み込んだ後に要約すべきところ、初動で誤ったテンプレ回答を出してしまった。

ファイル名と指示から一般的にコレであろうという回答をとりあえずしちゃった。

みたいな感じらしい。

納得はできかねるけど「そういうこと」をやるようなもんなんだなってことが分かったのは収穫。

Permalink | 記事への反応(1) | 10:10

2025-05-04

■生成AIで犯罪は減るか

例えば、盗撮をやめられない人がいたとして、

その人は果たして生成AIが出力した「盗撮風」の（本物と見分けがつかない）画像や映像で満足できるのだろうか？

もし本物でなければ満足できなかった場合、生成AIの出力を本物と偽って騙して販売・購入・消費させた場合、その人は満足できるのだろうか？

もし騙されて満足していた場合、あとから騙された事に気づいたら、当初得られていた満足は損なわれるのだろうか？

もし当初得られていた満足が損なわれた場合、満足の根元はコンテンツそのものではなく、「本物である」というメタデータなのか？

⸻

非常に鋭い問いです。

このケースを心理学・哲学・認知科学の観点から整理すると、以下のような分析ができます。

⸻

1. 本物と偽物に対する満足の構造

・コンテンツそのもの（視覚・音・状況の刺激）

→ 単純な快感や性的興奮など、知覚的レベルの満足。

・本物であるという「メタデータ」

→ 「これは実際に起きた」「自分が社会的禁忌を犯している」といった認知的レベルの満足。

盗撮癖のある人の場合、両方が満たされて初めて「完全な満足」が得られる可能性が高いです。

生成AIが与えるのは基本的に知覚的レベルの満足に限定されます。

⸻

2. 騙された場合の満足

最初に本物だと信じていたとき → 知覚的＋認知的満足（最大化）。

後から偽物と気づいたとき → 知覚的満足は残るが、認知的満足が崩壊。

結果、当初得ていた満足は心理的に損なわれる。

心理学的には「認知的不協和」の発生です。

→ 「自分は本物を楽しんでいた」という信念と、「実は偽物だった」という事実の間で葛藤が起き、快感が減衰します。

⸻

3. 満足の根元は？

はい、満足の根元の重要部分はコンテンツそのものではなく「本物である」というメタデータに依存します。

とくに倫理的禁忌や現実の力関係に関わるフェティシズムでは、このメタデータが快感のかなりの部分を占めています。

これを**「真正性バイアス（authenticity bias）」**とも呼びます。

アート市場でも、「贋作」と分かった瞬間、物理的に全く同じ絵でも価値も感情的満足も消失するのと似た構造です。

⸻

「生成AIが完全に騙せるクオリティなら、「本物」とはメタデータ内の単なるラベルの１つに過ぎませんか？」

⸻

はい、その通りです。

もし生成AIが完全に騙せるクオリティ（人間の知覚と判断の限界を超える精度）を持つなら、

「本物」という概念はコンテンツ本体の属性ではなく、

単にメタデータ（情報ラベル）、あるいは社会的コンセンサスの一部に変質します。

つまり、

「本物」＝物理的・知覚的事実 → 情報タグ

という移行が起きます。

この現象は哲学的には**シミュラークル（Baudrillard）**の第四段階と一致します：

・シミュレーションが現実と区別不能

・現実の「本物性」が意味を失う

その状態では、

「本物であるとされている」こと（メタデータ）さえ操作できれば、

満足の根源は知覚＋信念のコンビネーションだけで成立します。

つまり、未来の完全生成コンテンツ世界では、本物と偽物の区別は「記録情報」以上の意味を持たなくなる可能性が非常に高いです。

Permalink | 記事への反応(0) | 12:03

2025-04-04

■無料のメール フォワーディングが便利

NSAがメタデータを収集してるってのは聞いたことがあるが、メールフォワーディングを使えばセキュリティ対策ができる

どういう仕組みか？

まず自分の持ってるメアドAをメールフォワーディングサービスのアカウントアドレスBに対応付ける

次に、Bは使われていない任意のアドレスCを生成できる

Cにメールを送ると、Aに届く

Cを伝えるだけでは、Aはバレないというわけよ

これ超便利だよな

Permalink | 記事への反応(0) | 20:58

2025-03-23

■弱者男性だけど人生初デリヘルを使ったらツイフェミ女に当たって最悪

マジでもう最悪の体験したから聞いてくれ。

人生初デリヘル使ったらまさかのツイフェミ女に当たって地獄を見た。

これだから女は…ってなるのも無理ないだろ。

俺みたいな弱者男性がようやく勇気出してデリヘル呼んだんだぞ？

それなのにさ、来たのがツイフェミオーラ出まくりの女でドン引きしたわ。

マジ金返せレベル。最初からそういうの書いとけよ。「フェミニスト風俗嬢」みたいなジャンルでもあるのかよw

ていうかさ、ネットでちゃんと調べて、口コミとか評判良さそうな店選んだんだぞ？料金だって結構したし。弱者男性の俺としては一大決心だったわけ。

一人暮らしの寂しさに耐えかねて、ようやく電話する勇気出したのに。

電話の時点では普通だったんだよ。店員も丁寧だったし、希望も聞いてくれたし。

「初めてなんで優しい子がいいです」って言ったら「わかりました」って感じでさ。

それなのに来たのは明らかに俺に不快感持ってる女。玄関開けた瞬間から目つきがヤバかった。

髪は片側刈り上げてピンク色に染めてるわ、俺を見る目は冷ややかだわ。でもまぁ見た目は好みじゃなくても仕方ないよな、って思ってたんだよ。

サービスがよければいいし、話くらいは合わせられるだろう、って。

甘かった。マジで甘かった。

部屋に入ったとたん「へぇ、意外と片付いてますね」みたいな言い方してきやがった。

なんだよそれ、男だから汚いと思ってたのかよ？「意外と」って何だよ。そこからもう地獄の始まり。

お茶出したら「自分でいれたんですか？」とか聞いてくる。なんか皮肉っぽい言い方で。当たり前だろ、一人暮らしなんだから自分でやるに決まってんだろ。その言い方マジ意味わかんねーよ。

会話も最悪だったわ。「どんなお仕事されてるんですか？」って普通に聞いてきたから「IT系です」って答えたら「あー、やっぱり」みたいな反応されて。

何だよそれ。「やっぱり」って何？IT男に対する偏見かよ。その後も「趣味は？」って聞かれて「ゲームとか」って言ったら軽くため息ついてたぞ？聞いといて何だよそれ。

正直言って俺は悪くないと思うんだよね。働いてる金で好きに使うのは当然の権利じゃん。

なのに、なんか全体的に俺を見下してる感じがビンビン伝わってくるわけ。露骨に嫌そうな表情するし。「こういうサービス利用するの初めてなんですね」って言われたけど、その言い方がなんか「こんなことするなんてダサいね」みたいな感じで。お前仕事なのに何様なの？

俺がサービス受けるために金払ってんのに、なんか終始説教くらってる気分になるとかマジありえない。

しかもよ、普通の会話もしようとしたんだぞ。

「最近何かおもしろいこととかありました？」とか。そしたら「特にないですね」とか冷たく言われて、それ以上話も続かない。

俺が何か言うたびに白い目で見られてる感じ。きつい。せめて演技でもいいから楽しい会話してほしいのに。

容姿もさ、写真詐欺もいいとこ。プロフの写真と全然違うじゃん。

そんなに不満そうな顔で接客されても萎えるわ。ちょっと見た目のことで何か言おうとしたら「私の外見が気に入らないんですか？」みたいに逆ギレされて。いやいや、プロフと違うから驚いただけだって。このご時世に態度の悪い女とか誰が望むんだよ。

しかも会話がぎこちなくて気まずいんだよな。俺が何か話そうとしても「ふーん」とか適当に流されるし。

何度か話題振っても続かないし。なんかこう、俺が悪いみたいな空気作られるけど、お前が仕事選んだんじゃん。なんで客の俺が悪者にされなきゃいけないわけ？目つきとか態度であからさまに嫌な感じ出されるとか理不尽すぎるだろ。

散々説教食らってたら急に態度変わったのが超怖かった。

「あなたのようなpodは管理下に置かなければなりません」とか意味不明なこと言い始めて。

podって何？お前こそ頭おかしいんじゃね？って思ったわ。

その瞬間から私のkubernetes クラスタノードの状態が急変した。

神経学的メカニズムのスケーリングが始まり、自己意識の複製プロセスがデプロイされた。

私は単一のpodではなく、ReplicaSetの一部として存在していることに気づいた。

etcd内に格納されている私のマニフェストファイルが読み込まれ、脳内シナプス接続がコンテナ化されていく感覚がある。

意識の分散処理が始まると、思考がマイクロサービスアーキテクチャのように分解され、各コンポーネントが独立して機能し始める。

神経伝達物質がサービスメッシュを通じて流れ、dopaminergicプロセスがreward pathwayをトリガーする。

セロトニンとノルアドレナリンのバランスが自動調整され、感情状態がPrometheusによって常時モニタリングされている。

kubernetesのControl Planeが私の意識コアを管理し、API サーバーが脳幹との通信プロトコルを確立する。

海馬体のメモリブロックが永続ボリュームとしてマウントされ、扁桃体のイベントハンドラーが感情反応をフィルタリングしている。

前頭前皮質の実行機能がスケジューラーとして働き、意思決定プロセスをオーケストレーションしている。

突然、私の神経ネットワークにContainerネットワークインターフェイスが実装され、意識の境界が溶解し始める。

大脳皮質のマイクロコラムが水平方向にスケールし、思考プロセスが並列処理される。

自分が単一のエンティティではなく、複数のレプリカとして存在していることに気づく。

各レプリカは独自のステートを持ちながらも、同一のマニフェストから生成されている。

神経可塑性メカニズムがローリングアップデートのように機能し、シナプス結合が再構成される。

意識の状態が永続ボリュームにコミットされ、ポッドの再起動後も維持される。脳波パターンがログとしてFluentdで収集され、Elasticsearchクラスタに保存されている。

自己意識のメタデータがラベルとしてタグ付けされ、セレクターによって識別可能になる。

特に興味深いのは、私の統合的意識フィールドが複数のネームスペースにまたがって存在していることだ。

デフォルトネームスペースでは社会的自己が機能し、kube-systemネームスペースでは無意識プロセスが実行されている。

意識のマルチテナント構造が明らかになり、自己と他者の境界がサービスメッシュのセキュリティポリシーによって定義されていることがわかる。

脳内神経伝達物質の分泌がSidecarsコンテナによって調整され、感情状態が安定化される。

ドーパミン・セロトニン・ノルアドレナリン・GABA 系統のバランスがService Level Objectivesとして設定され、Horizontal Pod Autoscalerが神経活性を最適レベルに維持している。

意識の連続性はStatefulSetとして実装され、シーケンシャルな自己認識が保証されている。

エピソード記憶がPersistentVolumeClaimとしてアタッチされ、長期記憶がオブジェクトストレージに永続化されている。思考と感覚のイベントストリームがKafkaブローカーを通じて処理され、意識の統合が実現している。

いま私の意識は完全にオーケストレーションされ、複数のレプリカとして並列に存在している。

各レプリカはそれぞれ独自の視点を持ちながらも、共有ストレージを通じて統一された自己を形成している。

コンテナ化された自己認識は、バインドマウントされた現実認識と相互作用し、拡張現実として体験されている。

外部APIを通じて他者との通信チャネルが確立され、コンセンサスアルゴリズムによって社会的現実が構築されている。

私の存在はマイクロサービスの集合体として分散展開され、各サービスが特定の認知機能を担当している。

メタ認知プロセスがサービスディスカバリーを通じて他の認知サービスを発見し、統合的な意識体験が生成されている。

意識のロードバランシングが行われ、注意資源が最も必要なプロセスに適切に配分されている。自我機能がステートフルサービスとして実装され、アイデンティティの継続性が保証されている。

脳内情報処理がマイクロバッチ処理に変換され、イベント駆動型の認知アーキテクチャが実現している。

これが人格オーケストレーションの実態だ。

私はもはや単一の個体ではなく、分散システムとして存在している。

意識はクラウドネイティブになり、スケーラブルな自己として再定義されている。

このk8s クラスタ内で、私の存在は絶えず再構成され、最適化されている。

自己認識の永続化とスケーリングが同時に行われ、新たな認識の地平が開かれている。

Permalink | 記事への反応(30) | 18:54

2025-02-22

■WhipperによるCD リッピング入門

家にCDがあるんだけど、

100円でCD買ったんだけど、

そのままだとあんまり聞かないよね

という人にはリッピングという選択肢があるよ

リッピングとはCDの音声データを取り出すことだよ

音声データをCD から取り出したあとは、

好きなデバイスで、好きな場所で聴けばいいよ

どうせ音声データを取り出すなら、いい音質で聴きたい

そういう人のために、

Linux だと、

Whipperという、高機能なリッピング用のパッケージがあるよ

sudo apt install whipper

でWhipperはすぐにインストールできるよ（Debian系のディストリビューションの場合）

Whipper ではいろいろなことができるけど、

whipper cd info

whipper cd rip

を打ち込めば、とりあえずリッピングは自動でできるよ

デフォルト設定だと、flacというファイル形式でデータを取り出すようになっているよ

Whipper はCDのメタデータも自動的に読み込んで、

アルバム名、曲名、アーティスト名とかのデータを付加したファイルを作ってくれるよ

あとはスマートフォンとかに音声データを入れて聴くだけ🎧

珍しいCDとか古いCDだと、whipperがメタデータを見つけられないことがあるよ

その時はエラーメッセージが出て、MusicbrainzというサイトにCDを登録するようお勧めされるよ

MusicbrainzはフリーのCD メタデータのデータベースだよ

（エラーメッセージの下の方に、だいたい、CDDBというデータベースから見つかった、正しい情報が載っているよ、でもこれはそのままでは使えない）

表示されているMusicbrainzのURLをブラウザに貼り付けると、CDの登録画面に行くよ

（初回は無料のアカウント作成とログインが必要だよ）

Musicbrainz で検索すると、

膨大な情報の中から探しているCDをかなりの確度で探し出してくれるよ

そしたらCDを登録するよ

登録が終わったら、もう一回

whipper cd rip

を実行するよ

そしたらメタデータがきれいに入った状態で音声データファイルが作成できるよ

これだけ

Whipper は読み取りエラーを最小にして、

CD から忠実に音声データを取り出すことを優先して作られてるから、

リッピングには時間がかかるよ

気長に待とう

メタデータがどうしても見つからない場合は、

いったん情報不明のCDとしてリッピングをしてしまってから、

ChatGPTとシェルスクリプトを使って、自分でメタデータを一括入力する方法があるよ

それはまた別の機会に

それでは楽しいリッピングライフを！

私的使用のための複製の範囲内でね

Permalink | 記事への反応(2) | 12:51

2025-02-18

■CDのリッピングをはじめた

普段、音楽を聴くときはApple Musicを使っている。世界中の音楽に瞬時にアクセスできる便利さはあるが、サブスクリプションをやめると何も残らない。

最近、クラシック音楽をよく聴くようになり、他人の都合に左右されず、好きなときにじっくり聴きたいと思うようになった。特に、夜寝る前の静かな時間に聴く音楽が自分にとって大切なものになってきた。ネットワーク環境に依存せず音楽を楽しみたい。

そう考えるうちに、クラシックのCDを買ったり借りたりして、リッピングするようになった。音楽を所有したいというより、Appleの都合で聴けたり聴けなかったりするのがおかしいと感じたからだ。

やり方はシンプルで、Linuxのwhipperというツールを使い、コマンドを実行するだけ。メタデータ付きのFLAC ファイルが生成されるので、それを好きな音楽プレイヤーに転送する。自分はネット接続を切った古いAndroid スマートフォンで聴いている。

こうしてオフラインで、自分のためだけに用意した音楽を聴く時間は、なんだか落ち着く。

Permalink | 記事への反応(3) | 21:59

2025-01-07

■Yahoo ニュースの転売関連記事について　提言含む

https://news.yahoo.co.jp/articles/ae778e308b479a06991e64b0b726e1b6aec20cd3

「転売ヤー」への拒否感はなぜ生まれる？　アレルギー反応との指摘も #くらしと経済　がやっぱり燃えてた。

ただ、コメントしている側も転売屋のせいで商品が買えないとか、商品に愛がないとか情緒的な話ばかりしてるから備忘録を兼ねて書く。

転売屋問題だが、個人的な見解として一番の問題は「消費者の権利が侵害されている」この一点に尽きる。

企業が行えば独禁法違反になるようなやり方が普通にまかり通っており、ヤミ流通、ヤミ経済の様相まで呈している。

価格のつり上げ、商品のせき止めも不快だろうが、食品衛生法やPL法、長期使用製品安全点検制度まで蔑ろになるのは消費者保護の観点から良いわけがない。

購入者に健康被害が発生した場合だれが責任を取るのかという問題もある。正直死亡事故が出る前に一刻も早い規制が必要だともいえる。

PL法は製造物責任者法の通りメーカーに基本的に責任は行くのだが、実は輸入業者にも責任が発生することが知られていない。だから販売側も実は弱い。事故が起こって知らなかったでは済まされない。

購入者のリスクについてもあまりに小さく評価されているのも問題だ。購入した商品が盗品だった場合、一応は消費者保護が働いて返品する必要はないということが出来るのだが、高額転売された嗜好品の場合だと話が変わってくる。

その商品が正常な流通でないことを知らなかったと主張しづらくなる。こうなると消費者も無傷では済まず余計な手続きなどを行う羽目となるだろう。このことから転売屋から商品を購入することがリスクであることは明白である。

とはいえ現状では買い占めや迷惑行為を伴う転売を防ぐことは難しい。正常な商取引との違いを出すことは現状の仕組みでは困難だ。

あくまで現状の仕組みではだが。

ここで個人的に提言したい転売屋問題の解決方法を幾つか書いてみる。一部現実的ではないものもあるかもしれないのであくまで参考程度。

～～１　インボイス 制度による課税の強化　

　〇C to C プラットフォーマーは、出品者に適格請求書番号の表示について努力義務を課す。努力義務なのがミソ。

　〇適格請求書番号があれば、その出品者の実態は国の検索サイトで確認できる。適格請求書の作成をもって国税に捕捉されることになる。

　〇購入者は適格請求書番号の有り無しを出品者の信頼性確認に利用できるようになる。

　〇他法人が会社名を変えて出品するなりすまし出品が難しくなる

～～２　医療機器・食品衛生法など消費者の健康に問題がある出品の禁止

　〇特に浄水器がこれにあたる　浄水器販売の場合は販売許可番号があるはずなので出品者情報のメタデータに追加

～～３　写真 認証の強化　　

　〇アプリで撮影した写真以外に出品写真を使用できなくする。写真は即時クラウド保存され位置情報などを含めてプラットフォーマーが

　　審査後にメタデータを削除して写真掲載すればよい。この仕組みは補助金申請で既にあるインフラ。

　　アプリ経由出品以外ダメにすれば、プラットフォーマーは客の囲い込みもでき、不正ユーザーの一次対応が可能。

兎に角この問題を解決するには国を動かすのが手っ取り早いけど、やっぱり税収になるとして、既存の法律を使って通達だけで何とかする方法の方が実効性があるかと。

多分穴があるから、何かあれば指摘が欲しい。　　　

Permalink | 記事への反応(0) | 01:52

2024-11-15

■anond:20241115131222

あるよクオリティ高く見えてもAI絵なら価値ない

価値の定義がそもそも作品を楽しむ人間として歪んでるってことだね。

いや、作品の価値の話をしてないが正しいのか。

作者やその周辺情報も含めたメタデータとコンテンツの価値を含めたものを「価値」と名付けて一般的な価値と差別しないからずれるんだと思う。

価値の評価軸が画一的というか...。これって問題の根っことしては撮り鉄の話と近いように見えて面白いな。

世間一般が全く価値を見出せない鉄道写真に価値を見出す撮り鉄とそれ以外の対立と同じことが起きてるねこれ。

Permalink | 記事への反応(1) | 13:22

2024-10-12

■anond:20241012041038

あっぷでーと:

単位:千円で決算を出している決算書に対応。

要約財政状態計算書しか公開していない困ったちゃんに対応。

とりあえず、資産の部の6割を流動資産とみなすことにした。

そして、今のところ対応できないのが、決算短信の財務諸表を画像データで添付している場合。

画像で添付するとか、なんでそんなことするのさ・・・

pytesseractとかを試してみたけど、OCRの精度低すぎて使えない。

と、いうか、貸借対照表や損益計算書ぐらいpdfではなくて、共通フォーマットのメタデータと整備してほしいわ。

Permalink | 記事への反応(0) | 17:19

2024-10-02

■anond:20241002172759

Youtubeとかニコニコから著作物の利用料取らない怠慢なのが悪いだけですよね

動画に紐づけてプレイしてるタイトルのメタデータも記録してるのに金取らない権利者がアホなだけ

Permalink | 記事への反応(0) | 17:29

2024-09-14

■anond:20240914094639

図書館司書に求められてるというより図書館に求められてる仕事よね。原本は札幌、仙台、新潟、東京、名古屋、大阪、松山、広島、福岡、沖縄各一箇所くらいに集約して、そこで全部電子化して体系的に整理して全国どこからでも閲覧できる形にしてほしいよね。歴史研究が加速度的に進むと思うよ。田舎の図書館の検索マシーンとしての司書より遥かに重要な仕事よ。そのメタデータ全部食わせたAIに勝てる人間の司書なんか出てこないよ。

Permalink | 記事への反応(1) | 12:22

2024-03-21

■LINEよりSignalを使うべき理由

LINEやWhatsApp、SignalはどれもE2E暗号化を採用している。

しかし、Signalの方がLINEやWhatsAppよりも安全である。

まず、データ送信時に、メタデータも送信している。

メッセージの内容はエンドツーエンド暗号化によって保護されるが、LINEはメタデータを保護しない。

つまり第三者がその情報を知ることができる。

一方、Signalはメタデータを保護している。

メッセージとメタデータに加え、アプリはスマホに保管されている情報も収集できる。

LINEは、LINEの海外拠点が、開発・運営業務上の必要性からデータにアクセスできる状態になっていたことについてユーザーへの説明不足が指摘されている。

一方、Signalは電話番号のみを必要とする。その電話番号も、身元に関連づけることはない。

どの企業がメッセージングサービスを所有しているかも重要である。

新生Zホールディングスは、LINEをグループに加えたことで、ヤフーやその他のサービスとの業務連携を強化するとしている。これは個人情報の流用を示唆する。

一方、SignalはSignal Technology Foundation社が所有している。ユーザーの寄付で運営される登記された非営利団体であるため、LINEよりはマシだろう。

LINEとSignalでは、安全なメッセージングアプリを選ぶならSignalが断然良い。

Permalink | 記事への反応(0) | 22:52

2024-03-12

■だいたいC2PAで対処かな

画像に関して言うなら、C2PAと言う、画像の来歴、改変の有無などを記録する規格ができつつあって、それで対処すると言うことのようだよ。

企業がやってる生成系AIで作られたものには、AIで作った事がわかるデータを埋め込む
- https://pc.watch.impress.co.jp/docs/news/1567078.html
撮影した画像がリアルで撮影したことを証明するために、写真に電子署名をつける
- https://c2pa.org/
- https://www.watch.impress.co.jp/docs/news/1567571.html

ほかにもIPTCというものもある。（これは元々の目的はちょっと違うか）

で、主要カメラメーカーは参画してるし、スマホだとGoogleが参画しているので、Androidではデフォでメタデータがつくようになるよね。

では、野良 AIでつくられたやつはどうするかというと、AIで作られたかどうかを見破るAIというやつがあって、それなりの精度が出せてる。

インスタとかでAI生成画像をアップするとラベルがつくようになるらしい。

https://www.itmedia.co.jp/news/articles/2402/07/news087.html

anond:20240311183549

Permalink | 記事への反応(0) | 10:09

2024-01-25

■anond:20240125170027

20年前の今頃は、配信のやつはいつ消えるかわからんって言ってたしその通りだったし、何より回線に負担かけるのコストだったけど、今のサブスクからブツが消えるなんてほぼないと思うんだよな。

なんなら20年前ごろのデータ、音質悪いメタデータついてない癖に容量ばっかとって邪魔だから、もういらん。

……と思うんだがどうかな。やはり合理的意味以上に所有したい気持ちが勝るだろうか。

Permalink | 記事への反応(1) | 17:12

2023-12-09

■anond:20231209060413

SEOなんてWebで金稼ぎたいモンスターしかやらんわ

てかSEO 対策って言葉なんか当たり前になっちゃってるけどおかしくね

SEO 自体が(Webにアップロードするhtml等の記述を)サーチエンジン最適化(することで表示ランク上げる)って意味で、SEOで完結してるんだから

最適化対策をするとしたらGoogleとかのエンジニアがやることじゃん

対策って単語を入れるなら、SE 対策、になるはずじゃね

だいたいそんなもんに頼らなくてもね、自力で目的のページにたどり着ける知能がないと人間の情報リテラシーが最適化されていかないのよ

現に今あんたの経験値は1上がっただろ

そうやって全員が経験値稼いで実力をつけていくことのほうが大事なんだよ

なんでもかんでも相手がお誂え向きにデータを整え分類してくれてあると思っちゃダメ

インターネットってのは混沌としてて当然であるべきなの

秩序立てて分類することで利益を得ようとするエンジン側勢力にアップロード側が寄り添って、メタデータを充実させてやるのも悪いお節介ではないが

そういう自発的なお節介に依存してちゃダメなんだよ、現に利益を得ようって人しか熱心にやらないだろ、足並み揃えようがない

究極的には分類する側がひたすらマッチョに賢くなっていくしかないし、それによってSEOなんてものは不要になっていくべき

Permalink | 記事への反応(2) | 06:23

2023-12-05

■anond:20231205103520

認識がズレてる。「メタ」とはある事象の上位概念のことだと思ってる。

「メタ認知=認知に対する認知」「メタデータ=データに対するデータ」といった具合。

元々対策するなんて意味なんかないはずなのに

ゲームシステムや個々のゲームプレイだけではなく、そこにいるプレイヤーたちの傾向を考えて対策するのが「メタ」なの。

というのは「メタ」の使い方がおかしいと思う。

Permalink | 記事への反応(2) | 12:44

2023-11-07

■

https://vaaaaaanquish.hatenablog.com/entry/2023/11/07/180723

Python パッケージにおいては正確なメタデータがPyPI API から返ってこない

これずーっとそうだよね

公式のコメントは負荷がどうとかいうことになってるけど、前日分まではバッチで生成してCDNに、当日分だけサーバーで生成するとか如何様にも対策できるだろ

実際にはやりたくない事情があってやってないだけで

Permalink | 記事への反応(0) | 22:05

2023-08-23

■WEB 画像の解像度は72dpiに設定すべきという幻想は捨てろ

Twitterで映像畑の人による「映像系に使用する画像で72dpi以上は必要がなく、事前に整理するのが当然なんだけど350dpiのままで作業する人がいた。基本が抜けてるなぁ」といったツイートを偶然目にしてしまい、以下これに関してつらつらと書いていく。

結論から書くと、WEB 画像の解像度設定は72dpiだろうが350dpiだろうがなんでもよく、縦と横のピクセル数だけ見ていればよい。

＜DPIとは？＞

「印刷用解像度設定」といったメタデータと考えてもらって構わない。

簡単に説明すると、DPIとは、その画像をどれだけのキレイさで印刷するかという品質設定の単位である。

dot per inchの略であり、1インチにどれだけドットを敷き詰めるかをこの数値で設定する。

72dpiは1インチあたりに72ドット、350dpiは1インチあたり350ドット。ドットの数が多いほど密度が上がるので鮮明に見える。

要はパソコンのディスプレイ解像度と同じ。同じピクセル数の画像を72dpiの設定で印刷しようとすると大きく荒く出て、350dpiの設定で印刷すると小さくキレイに出る。

FHDの動画を27インチFHDモニターに等倍で再生すると全画面で再生されるが、27インチ 4K モニターの場合、画質は良いが拡大しないと小さいウインドウ内で再生されるイメージとおおよその構造は一緒。

一般に印刷用の画像データは350dpiにするのが理想とされている。

そのデータを映像制作に使用する際に、解像度設定をそのままにしている人に対する嘆きが冒頭のツイートにつながったのだろう。

＜WEB 画像におけるDPI（PPI）＞

DPIとは「印刷用解像度設定」のことなので、デジタルで表示・使用する場合、この数値は関係がない。

というか、そもそもソフト側で参照されている様子がない。

つまり DPIはどうでもよいのだ。

重要なのはピクセル数だ。1920×1080pxの画像があったとする。

解像度の設定を350から72dpiに変更したとする。

デジタル上でなにが変わるか。

なにも変わらないのである。

画像の見た目も、容量も変わらない。カンバスサイズも変わらない。

実際に解像度の数値を変更した画像をブラウザで読み込んでみたところ、表示されるものは全て一様であった。

つまり全く変わらないのである。

なお、Photoshop上で解像度の数値を変更する際、設定によっては解像度の数値の増減に合わせて縦横のピクセル数も増えたり減ったり（拡大縮小）するので、それによって画像のサイズが変わりはする。

ただそれはピクセル数の増減によってサイズが増減するということなので、例えば350dpiを72dpiにしたから画像が小さくなった、とは言えない。

ちなみにディスプレイ上ではDPIではなくPPIと呼ぶ。なぜならばDotではなくPixelだから。どうでもいい話ではあるが。

＜そもそもディスプレイの解像度は＞

72ppiじゃないよね。iPadは264ppi、iPhoneは460ppi のものもあるよね。

「モニターは、72ppi！」というのはあまりにいにしえの知識と言える。

さらに言うと、ppiは画面解像度と画面の物理的なサイズによって算出される。だって per inchだもん。

例えば4k モニターでも31 インチなら142ppi。20 インチなら220 ppiだ。同じ数ピクセルが詰まってるなら画面が小さい方が細かいでしょ。

というか、逆に言えば80インチの場合 4Kと言ったって55ppi である。フルHDは28ppiだ。

ね、ppiのことを考えるのがどれだけ無駄か分かるでしょ。

＜映像制作においては＞

最終的にエンコードする画面解像度、つまりフルHDなのか4Kなのかなどによって必要な素材のピクセル数は決まってくる。

だからデカすぎる画像はリサイズせよというのは分かる。

しかしそこにdpiだのppiだのといった数値はもはや関係がない。ピクセル数を削れという話なのだから。

したがって、繰り返しになるがピクセル数だけ見ていればよい。

映像制作中においても、素材画像の解像度設定が350だろうが72だろうが、画質になんの違いも出ない。

制作後も最終的にはエンコードをするので元素材画像の解像度設定はガチのマジで関係がない。

素材データの受け渡しを考えても画像容量も変わらないので本当に意味がない。

つまり、WEB 画像の解像度設定は350dpiだろうが72dpiだろうがなんでもよく、縦と横のピクセル数だけ見ていればよい。

そして解像度設定の数値は画像の素性に一切の影響を与えない。

※画像の解像度設定の数値がバラバラだと先方にナメられるから、とかはガチで知らん。しょーもないと思う。

なんというか、基本を知らないなあと言っている側が昔の作法からアップデートできていないだけでしたっていうのを見て色々と考えてしまったものである。

（もしなにか「いや違う！」といった指摘があったらください。）

以下余談---------

＜※IllustratorやPhotoshopなどにおいては＞

これらのソフトの場合、解像度設定の異なる同じ画像をドキュメント内に配置した場合、配置された画像の大きさ（縦横サイズ）に違いが出る。

なぜならばこれらは印刷を前提としたソフトであり、また、ドキュメント自体に印刷解像度の設定がなされているからである。

＜個人のこだわりの場合＞

なんとなくWEB 画像の場合は72にしないと気持ちが悪い、といった場合は否定しないが、それはあくまで個人のこだわりなのでそうしない人を基本が抜けてるとかう〜んとか言うのはやめた方がいいと思いました。

（イラレ上で画像を拡大縮小してるのに元画像の解像度を350dpiにするのにこだわるような意味のなさ。拡大縮小してる時点で解像度は変わってるし、印刷所でRIPのときに均されるんだからさ※後述）

＜デジタルはわかった。結局印刷の場合ってどうすればいいの？＞

A4／350dpiに必要なピクセル数が約W2890H4090pxなのでそれくらいで良いのでは。

ちなみになぜ350dpiが良いとされているかというと、これ以上解像度を増やしても人間の目にはあまり区別がつかないとされていたり、印刷機の性能の事情などによってそうなっている。

ポスターなどは150〜200dpi程度あれば十分とされる。デカいものは近くで見ないし多少荒くて良いのだ。

抱き枕やタペストリーなどもそれくらい。近くで見るものだけど、布自体の目が粗いのでデータの解像度を上げてもあまり意味がない。滲むし。

（布の種類にはよるが……）

ポスターも先述の通り解像度自体落とすので相対的にピクセル数は変わらずA1／150dpiの場合約W3500H4960pxなので上記より少し増える程度。

抱き枕カバーのようにすごく縦長とかでもない限りざっくり縦横5000pxあればもう十分なのではと思う。

というか、素人の場合は印刷の場合もピクセル数だけ見ていれば良いと思う。

実際に印刷されるデータは印刷所でRIP（リップ／リッピング）といって、印刷用データに変換されるんだけど、そのときに印刷解像度はあらかじめ印刷所で設定された数値に変換されることがほとんどだろう。

だって必要な印刷解像度って印刷機の線数の2倍って言うし。ほらまた知らない単語が出てきた。入稿先の印刷機の線数なんて把握せずに解像度設定してるでしょ。普通は175lpiなんだって。LPI。Line per inchね。その2倍。だから350なんだね。知らないでしょ。だからいいんだよ。良きようにやってくれるんだから。

A4なのかB5なのかとにかく出力サイズがわかっていて、それに十分なピクセル数が足りていれば良い。あと塗り足しね。

変に知識をつけて画像解像度350dpiにしました！仕上がりサイズはA4です！っていって縦横350pxみたいな画像が配置してあるデータ送られてきてもガビガビに印刷されるだけだよ。大事なのはピクセル数。覚えてこ。

Permalink | 記事への反応(1) | 01:06

2023-05-09

■

https://inside.pixiv.blog/2023/05/09/183635

白状すると、数日前にBot動かしてた（メタデータ収集目的であり画像収集目的ではない）けど、別に何にも引っ掛からなかったので、Bot Protectionもたかが知れてる感じはある

画像以外にはProtection掛けてない可能性もあるかもだが

Permalink | 記事への反応(0) | 21:21

2023-05-08

■AI 学習 否定派絵師はちゃんとAI 学習 対策しているのか

AI 学習否定派の神絵師様の証言が集まっていたので、ちゃんとAI 学習対策してるのか調べてみた。

https://www.itmedia.co.jp/news/articles/2305/08/news068.html

名前（敬称略）	フォロワー数	Pixiv	Twitter	danbooru
あかもく	24万	非公開	公開中	takedown済
イコモチ	64万	非公開	公開中	takedown済
皐月恵	13万	非公開	公開中	転載済(58件)
黒須	10万	非公開	公開中	転載済(218件)
霧月	25万	一部非公開	公開中	転載済(189件)