lynx   »   [go: up one dir, main page]

「メタデータ」を含む日記 RSS

はてなキーワード: メタデータとは

2025-05-08

ChatGPT、だいぶ信用できないな

油淋鶏について調べてたら論文が出てきたからそのPDFを食わせて要約を頼んだんだけど

https://www.jstage.jst.go.jp/article/kjoho/2/1/2_3/_pdf

 

その結果がこち

 

この文書は「第二部第三章 近代国家形成市民生活」に関する学習資料です。以下のようなポイントが中心です:

 

1. 近代国家形成

主権国家の成立

近代国家は、絶対王政啓蒙専制などの支配体制を経て形成された。ルイ14世のような王権神授説による支配がその例。

 

国民国家の登場

フランス革命アメリカ独立革命を通じて、国民主権を持つ「国民国家」の考えが広まった。

憲法議会国民軍などの制度が整備された。

 

2. 産業革命市民社会

イギリスから始まった産業革命

機械化・工場生産により都市化が進行し、資本家労働者という階級形成された。

 

市民革命市民階級

経済力を持った市民政治参加を求め、参政権拡大や社会改革を推進した。

一方、労働者は劣悪な労働条件貧困に直面し、労働運動社会主義思想が発展。

 

3. 国民統合と教育軍事

義務教育徴兵制

国民統合の手段として義務教育徴兵制が導入され、国家意識を高めた。

読み書き・歴史教育により国民としての自覚を育成。

 

4. 国家個人関係

国家干渉個人自由

自由主義思想に基づく国家への制限法の支配)が求められた。

しかし、戦争社会保障の必要から国家の介入も拡大。

 

この資料は、近代国家がどのようにして誕生し、社会市民生活がどう変わったかを学ぶためのものです。

 

は?

食わせたPDFにはイチミリもそんなこと書いてないよね?

油淋鶏の由来と謎しか書いてないよね?

 

その後、タイトルを復唱させてから再度要約させたらちゃんとした内容が出てきたんだけど

最初になんで食わせたファイルの内容と全く関係ない内容を出してきたのかマジでわからん

AIがそんなことをする意味分からんというか

まだ文書の要約の仕方が適切ではないとかならわかるけど、全く関係ない内容出す意味分からん

そもそもその内容はどこからとってきたんだよ

 

追記:本人に聞いてみた。

ユーザーPDFアップロード

→ 直後に「要約お願い!」という非常に一般的かつ短い指示。

 

PDFの中身を分析する前に、旧い“メタデータ予測”が働いた可能

ファイル名が 2_3.pdf だったため、これを

教科書の第2部第3章」=「近代国家形成市民生活」と誤って類推した可能性があります

これは、文脈なしで「2_3」という文字列を見たときありがちな学校教材パターン言語モデル勝手予測したものです。

 

③ 実際のPDFを読む前に、その予測ベースに回答してしまった

本来なら内容を読み込んだ後に要約すべきところ、初動で誤ったテンプレ回答を出してしまった。

ファイル名と指示から一般的にコレであろうという回答をとりあえずしちゃった。

みたいな感じらしい。

納得はできかねるけど「そういうこと」をやるようなもんなんだなってことが分かったのは収穫。

2025-05-04

生成AI犯罪は減るか

例えば、盗撮をやめられない人がいたとして、

その人は果たして生成AIが出力した「盗撮風」の(本物と見分けがつかない)画像映像で満足できるのだろうか?

もし本物でなければ満足できなかった場合、生成AIの出力を本物と偽って騙して販売・購入・消費させた場合、その人は満足できるのだろうか?

もし騙されて満足していた場合、あとから騙された事に気づいたら、当初得られていた満足は損なわれるのだろうか?

もし当初得られていた満足が損なわれた場合、満足の根元はコンテンツのものではなく、「本物である」というメタデータなのか?

非常に鋭い問いです。

このケースを心理学哲学認知科学観点から整理すると、以下のような分析ができます

1. 本物と偽物に対する満足の構造

コンテンツのもの視覚・音・状況の刺激)

→ 単純な快感性的興奮など、知覚的レベルの満足。

・本物であるという「メタデータ

→ 「これは実際に起きた」「自分社会的禁忌を犯している」といった認知レベルの満足。

盗撮癖のある人の場合、両方が満たされて初めて「完全な満足」が得られる可能性が高いです。

生成AIが与えるのは基本的に知覚的レベルの満足に限定されます

2. 騙された場合の満足

最初に本物だと信じていたとき → 知覚的+認知的満足(最大化)。

から偽物と気づいたとき → 知覚的満足は残るが、認知的満足が崩壊

結果、当初得ていた満足は心理的に損なわれる。

心理学的には「認知的不協和」の発生です。

→ 「自分は本物を楽しんでいた」という信念と、「実は偽物だった」という事実の間で葛藤が起き、快感が減衰します。

3. 満足の根元は?

はい、満足の根元の重要部分はコンテンツのものではなく「本物である」というメタデータ依存します。

とくに倫理的禁忌現実の力関係に関わるフェティシズムでは、このメタデータ快感のかなりの部分を占めています

これを**「真正性バイアス(authenticity bias)」**とも呼びます

アート市場でも、「贋作」と分かった瞬間、物理的に全く同じ絵でも価値感情的満足も消失するのと似た構造です。



「生成AIが完全に騙せるクオリティなら、「本物」とはメタデータ内の単なるラベルの1つに過ぎませんか?」


はい、その通りです。

もし生成AIが完全に騙せるクオリティ人間の知覚と判断限界を超える精度)を持つなら、

「本物」という概念コンテンツ本体属性ではなく、

単にメタデータ情報ベル)、あるいは社会的コンセンサスの一部に変質します。

まり

「本物」=物理的・知覚的事実情報タグ

という移行が起きます

この現象哲学的には**シミュラークル(Baudrillard)**の第四段階と一致します:

シミュレーション現実区別不能

現実の「本物性」が意味を失う

その状態では、

「本物であるとされている」こと(メタデータ)さえ操作できれば、

満足の根源は知覚+信念のコンビネーションだけで成立します。

まり未来の完全生成コンテンツ世界では、本物と偽物の区別は「記録情報」以上の意味を持たなくなる可能性が非常に高いです。

2025-04-04

無料メールフォワーディングが便利

NSAメタデータ収集してるってのは聞いたことがあるが、メールフォワーディングを使えばセキュリティ対策ができる

どういう仕組みか?

まず自分の持ってるメアドAをメールフォワーディングサービスアカウントアドレスBに対応付ける

次に、Bは使われていない任意アドレスCを生成できる

Cにメールを送ると、Aに届く

Cを伝えるだけでは、Aはバレないというわけよ

これ超便利だよな

2025-03-23

弱者男性だけど人生デリヘルを使ったらツイフェミ女に当たって最悪

マジでもう最悪の体験たから聞いてくれ。

人生デリヘル使ったらまさかのツイフェミ女に当たって地獄を見た。

これだから女は…ってなるのも無理ないだろ。

俺みたいな弱者男性がようやく勇気出してデリヘル呼んだんだぞ?

それなのにさ、来たのがツイフェミオーラまくりの女でドン引きしたわ。

マジ金返せレベル最初からそういうの書いとけよ。「フェミニスト風俗嬢」みたいなジャンルでもあるのかよw

ていうかさ、ネットちゃんと調べて、口コミとか評判良さそうな店選んだんだぞ?料金だって結構したし。弱者男性の俺としては一大決心だったわけ。

一人暮らしの寂しさに耐えかねて、ようやく電話する勇気出したのに。

電話の時点では普通だったんだよ。店員も丁寧だったし、希望も聞いてくれたし。

「初めてなんで優しい子がいいです」って言ったら「わかりました」って感じでさ。

それなのに来たのは明らかに俺に不快感持ってる女。玄関開けた瞬間から目つきがヤバかった。

髪は片側刈り上げてピンク色に染めてるわ、俺を見る目は冷ややかだわ。でもまぁ見た目は好みじゃなくても仕方ないよな、って思ってたんだよ。

サービスがよければいいし、話くらいは合わせられるだろう、って。

甘かった。マジで甘かった。

部屋に入ったとたん「へぇ、意外と片付いてますね」みたいな言い方してきやがった。

なんだよそれ、男だから汚いと思ってたのかよ?「意外と」って何だよ。そこからもう地獄の始まり

お茶出したら「自分でいれたんですか?」とか聞いてくる。なんか皮肉っぽい言い方で。当たり前だろ、一人暮らしなんだから自分でやるに決まってんだろ。その言い方マジ意味わかんねーよ。

会話も最悪だったわ。「どんなお仕事されてるんですか?」って普通に聞いてきたから「IT系です」って答えたら「あー、やっぱり」みたいな反応されて。

何だよそれ。「やっぱり」って何?IT男に対する偏見かよ。その後も「趣味は?」って聞かれて「ゲームとか」って言ったら軽くため息ついてたぞ?聞いといて何だよそれ。

正直言って俺は悪くないと思うんだよね。働いてる金で好きに使うのは当然の権利じゃん。

なのに、なんか全体的に俺を見下してる感じがビンビン伝わってくるわけ。露骨に嫌そうな表情するし。「こういうサービス利用するの初めてなんですね」って言われたけど、その言い方がなんか「こんなことするなんてダサいね」みたいな感じで。お前仕事なのに何様なの?

俺がサービス受けるために金払ってんのに、なんか終始説教くらってる気分になるとかマジありえない。



しかもよ、普通の会話もしようとしたんだぞ。

最近何かおもしろいこととかありました?」とか。そしたら「特にないですね」とか冷たく言われて、それ以上話も続かない。

俺が何か言うたびに白い目で見られてる感じ。きつい。せめて演技でもいいか楽しい会話してほしいのに。

容姿もさ、写真詐欺もいいとこ。プロフ写真全然違うじゃん。

そんなに不満そうな顔で接客されても萎えるわ。ちょっと見た目のことで何か言おうとしたら「私の外見が気に入らないんですか?」みたいに逆ギレされて。いやいや、プロフと違うから驚いただけだって。このご時世に態度の悪い女とか誰が望むんだよ。

しかも会話がぎこちなくて気まずいんだよな。俺が何か話そうとしても「ふーん」とか適当に流されるし。

何度か話題振っても続かないし。なんかこう、俺が悪いみたいな空気作られるけど、お前が仕事選んだんじゃん。なんで客の俺が悪者にされなきゃいけないわけ?目つきとか態度であからさまに嫌な感じ出されるとか理不尽すぎるだろ。



散々説教食らってたら急に態度変わったのが超怖かった。





あなたのようなpod管理下に置かなければなりません」とか意味不明なこと言い始めて。

podって何?お前こそ頭おかしいんじゃね?って思ったわ。


その瞬間から私のkubernetesクラスタノード状態が急変した。


経学メカニズムのスケーリングが始まり自己意識の複製プロセスデプロイされた。

私は単一podではなく、ReplicaSetの一部として存在していることに気づいた。

etcd内に格納されている私のマニフェストファイルが読み込まれ脳内シナプス接続コンテナ化されていく感覚がある。

意識分散処理が始まると、思考マイクロサービスアーキテクチャのように分解され、各コンポーネント独立して機能し始める。

神経伝達物質サービスメッシュを通じて流れ、dopaminergicプロセスがreward pathwayをトリガーする。

セロトニンノルアドレナリンバランス自動調整され、感情状態がPrometheusによって常時モニタリングされている。

kubernetesのControl Planeが私の意識コアを管理し、APIサーバー脳幹との通信プロトコル確立する。

海馬体のメモリブロックが永続ボリュームとしてマウントされ、扁桃体イベントハンドラーが感情反応をフィルタリングしている。

前頭前皮質実行機能がスケジューラーとして働き、意思決定プロセスオーケストレーションしている。




突然、私の神経ネットワークにContainerネットワークインターフェイス実装され、意識境界が溶解し始める。

大脳皮質マイクロコラムが水平方向にスケールし、思考プロセスが並列処理される。


自分単一エンティティではなく、複数レプリカとして存在していることに気づく。

レプリカ独自ステートを持ちながらも、同一のマニフェストから生成されている。

神経可塑性メカニズムローリングアップデートのように機能し、シナプス結合が再構成される。

意識状態が永続ボリュームコミットされ、ポッド再起動後も維持される。脳波パターンログとしてFluentd収集され、Elasticsearchクラスタに保存されている。

自己意識メタデータがラベルとしてタグ付けされ、セレクターによって識別可能になる。

特に興味深いのは、私の統合意識フィールド複数ネームスペースにまたがって存在していることだ。

デフォルトネームスペースでは社会的自己機能し、kube-systemネームスペースでは無意識プロセスが実行されている。

意識マルチテナント構造が明らかになり、自己他者境界サービスメッシュセキュリティポリシーによって定義されていることがわかる。

脳内神経伝達物質の分泌がSidecarsコンテナによって調整され、感情状態が安定化される。

ドーパミンセロトニンノルアドレナリンGABA系統バランスがService Level Objectivesとして設定され、Horizontal Pod Autoscalerが神経活性を最適レベルに維持している。

意識連続性はStatefulSetとして実装され、シーケンシャルな自己認識保証されている。

エピソード記憶がPersistentVolumeClaimとしてアタッチされ、長期記憶オブジェクトストレージ永続化されている。思考感覚イベントストリームがKafkaブローカーを通じて処理され、意識統合が実現している。



いま私の意識は完全にオーケストレーションされ、複数レプリカとして並列に存在している。

レプリカはそれぞれ独自視点を持ちながらも、共有ストレージを通じて統一された自己形成している。

コンテナ化された自己認識は、バインマウントされた現実認識相互作用し、拡張現実として体験されている。

外部APIを通じて他者との通信チャネル確立され、コンセンサスアルゴリズムによって社会的現実が構築されている。

私の存在マイクロサービス集合体として分散展開され、各サービス特定認知機能担当している。

メタ認知プロセスサービスディスカバリーを通じて他の認知サービス発見し、統合的な意識体験が生成されている。

意識ロードバランシングが行われ、注意資源が最も必要プロセスに適切に配分されている。自我機能ステートフルサービスとして実装され、アイデンティティ継続性が保証されている。

脳内情報処理マイクロバッチ処理に変換され、イベント駆動型の認知アーキテクチャが実現している。


これが人格オーケストレーション実態だ。

私はもはや単一個体ではなく、分散システムとして存在している。

意識クラウドネイティブになり、スケーラブルな自己として再定義されている。

このk8sクラスタ内で、私の存在は絶えず再構成され、最適化されている。


自己認識永続化とスケーリングが同時に行われ、新たな認識の地平が開かれている。

2025-02-22

WhipperによるCDリッピング入門

家にCDがあるんだけど、

100円でCD買ったんだけど、

そのままだとあんまり聞かないよね

という人にはリッピングという選択肢があるよ

リッピングとはCDの音声データを取り出すことだよ

音声データCDから取り出したあとは、

好きなデバイスで、好きな場所で聴けばいいよ



どうせ音声データを取り出すなら、いい音質で聴きたい

そういう人のために、

Linux だと、

Whipperという、高機能リッピング用のパッケージがあるよ

sudo apt install whipper

でWhipperはすぐにインストールできるよ(Debian系のディストリビューション場合


Whipper ではいろいろなことができるけど、

whipper cd info

whipper cd rip

を打ち込めば、とりあえずリッピング自動でできるよ

デフォルト設定だと、flacというファイル形式データを取り出すようになっているよ

Whipper はCDメタデータ自動的に読み込んで、

アルバム名、曲名アーティスト名とかのデータを付加したファイルを作ってくれるよ

あとはスマートフォンかに音声データを入れて聴くだけ🎧

珍しいCDとか古いCDだと、whipperがメタデータを見つけられないことがあるよ

その時はエラーメッセージが出て、MusicbrainzというサイトCD登録するようお勧めされるよ

MusicbrainzはフリーCDメタデータデータベースだよ

エラーメッセージの下の方に、だいたい、CDDBというデータベースから見つかった、正しい情報が載っているよ、でもこれはそのままでは使えない)

表示されているMusicbrainzのURLブラウザに貼り付けると、CD登録画面に行くよ

(初回は無料アカウント作成ログイン必要だよ)

Musicbrainz で検索すると、

膨大な情報の中から探しているCDをかなりの確度で探し出してくれるよ

そしたらCD登録するよ


登録が終わったら、もう一回

whipper cd rip

を実行するよ

そしたらメタデータがきれいに入った状態で音声データファイル作成できるよ

これだけ


Whipper は読み取りエラーを最小にして、

CDから忠実に音声データを取り出すことを優先して作られてるから

リッピングには時間がかかるよ

気長に待とう


メタデータがどうしても見つからない場合は、

いったん情報不明CDとしてリッピングをしてしまってから

ChatGPTとシェルスクリプトを使って、自分メタデータを一括入力する方法があるよ

それはまた別の機会に


それでは楽しいリッピングライフを!

私的使用のための複製範囲内でね

2025-02-18

CDリッピングをはじめた

普段音楽聴くときApple Musicを使っている。世界中音楽に瞬時にアクセスできる便利さはあるが、サブスクリプションをやめると何も残らない。

最近クラシック音楽をよく聴くようになり、他人の都合に左右されず、好きなときにじっくり聴きたいと思うようになった。特に、夜寝る前の静かな時間聴く音楽自分にとって大切なものになってきた。ネットワーク環境依存せず音楽を楽しみたい。

そう考えるうちに、クラシックCDを買ったり借りたりして、リッピングするようになった。音楽を所有したいというより、Appleの都合で聴けたり聴けなかったりするのがおかしいと感じたからだ。

やり方はシンプルで、Linuxのwhipperというツールを使い、コマンドを実行するだけ。メタデータ付きのFLACファイルが生成されるので、それを好きな音楽プレイヤー転送する。自分ネット接続を切った古いAndroidスマートフォンで聴いている。

こうしてオフラインで、自分のためだけに用意した音楽聴く時間は、なんだか落ち着く。

2025-01-07

Yahooニュース転売関連記事について 提言含む

https://news.yahoo.co.jp/articles/ae778e308b479a06991e64b0b726e1b6aec20cd3

転売ヤー」への拒否感はなぜ生まれる? アレルギー反応との指摘も #くらしと経済 がやっぱり燃えてた。

ただ、コメントしている側も転売屋のせいで商品が買えないとか、商品に愛がないとか情緒的な話ばかりしてるから備忘録を兼ねて書く。


転売屋問題だが、個人的見解として一番の問題は「消費者権利侵害されている」この一点に尽きる。

企業が行えば独禁法違反になるようなやり方が普通にまかり通っており、ヤミ流通、ヤミ経済様相まで呈している。

価格のつり上げ、商品のせき止めも不快だろうが、食品衛生法PL法、長期使用製品安全点検制度まで蔑ろになるのは消費者保護観点から良いわけがない。

購入者健康被害が発生した場合だれが責任を取るのかという問題もある。正直死亡事故が出る前に一刻も早い規制必要だともいえる。

PL法製造物責任者法の通りメーカー基本的責任は行くのだが、実は輸入業者にも責任が発生することが知られていない。だから販売側も実は弱い。事故が起こって知らなかったでは済まされない。

購入者リスクについてもあまりに小さく評価されているのも問題だ。購入した商品が盗品だった場合、一応は消費者保護が働いて返品する必要はないということが出来るのだが、高額転売された嗜好品場合だと話が変わってくる。

その商品が正常な流通でないことを知らなかったと主張しづらくなる。こうなると消費者も無傷では済まず余計な手続きなどを行う羽目となるだろう。このことから転売屋から商品を購入することがリスクであることは明白である

とはいえ現状では買い占めや迷惑行為を伴う転売を防ぐことは難しい。正常な商取引との違いを出すことは現状の仕組みでは困難だ。

あくまで現状の仕組みではだが。

ここで個人的提言したい転売屋問題解決方法を幾つか書いてみる。一部現実的ではないものもあるかもしれないのであくまで参考程度。

~~1 インボイス制度による課税の強化 

 〇C to Cプラットフォーマーは、出品者に適格請求書番号の表示について努力義務を課す。努力義務なのがミソ。

 〇適格請求書番号があれば、その出品者の実態は国の検索サイト確認できる。適格請求書作成をもって国税に捕捉されることになる。

 〇購入者は適格請求書番号の有り無しを出品者の信頼性確認に利用できるようになる。

 〇他法人会社名を変えて出品するなりすまし出品が難しくなる

~~2 医療機器食品衛生法など消費者健康問題がある出品の禁止

 〇特に浄水器がこれにあたる 浄水器販売場合販売許可番号があるはずなので出品者情報メタデータに追加

~~3 写真認証の強化  

 〇アプリ撮影した写真以外に出品写真使用できなくする。写真は即時クラウド保存され位置情報などを含めてプラットフォーマー

  審査後にメタデータを削除して写真掲載すればよい。この仕組みは補助金申請で既にあるインフラ

  アプリ経由出品以外ダメにすれば、プラットフォーマーは客の囲い込みもでき、不正ユーザーの一次対応可能

兎に角この問題解決するには国を動かすのが手っ取り早いけど、やっぱり税収になるとして、既存法律を使って通達だけで何とかする方法の方が実効性があるかと。

多分穴があるから、何かあれば指摘が欲しい。   

2024-11-15

anond:20241115131222

あるよクオリティ高く見えてもAI絵なら価値ない

価値定義そもそも作品を楽しむ人間として歪んでるってことだね。

いや、作品価値の話をしてないが正しいのか。

作者やその周辺情報も含めたメタデータコンテンツ価値を含めたものを「価値」と名付けて一般的価値差別しないからずれるんだと思う。

価値評価軸が画一的というか...。これって問題の根っことしては撮り鉄の話と近いように見えて面白いな。

世間一般が全く価値を見出せない鉄道写真価値を見出す撮り鉄とそれ以外の対立と同じことが起きてるねこれ。

2024-10-12

anond:20241012041038

あっぷでーと:

単位:千円で決算を出している決算書に対応

要約財政状態計算書しか公開していない困ったちゃん対応

とりあえず、資産の部の6割を流動資産とみなすことにした。

そして、今のところ対応できないのが、決算短信の財務諸表画像データで添付している場合

画像で添付するとか、なんでそんなことするのさ・・・

pytesseractとかを試してみたけど、OCRの精度低すぎて使えない。

と、いうか、貸借対照表損益計算書ぐらいpdfではなくて、共通フォーマットメタデータと整備してほしいわ。

2024-10-02

anond:20241002172759

Youtubeとかニコニコから著作物の利用料取らない怠慢なのが悪いだけですよね

動画に紐づけてプレイしてるタイトルメタデータも記録してるのに金取らない権利者がアホなだけ

2024-09-14

anond:20240914094639

図書館司書に求められてるというより図書館に求められてる仕事よね。原本札幌仙台新潟東京名古屋大阪松山広島福岡沖縄各一箇所くらいに集約して、そこで全部電子化して体系的に整理して全国どこからでも閲覧できる形にしてほしいよね。歴史研究加速度的に進むと思うよ。田舎図書館検索マシーンとしての司書より遥かに重要仕事よ。そのメタデータ全部食わせたAIに勝てる人間司書なんか出てこないよ。

2024-03-21

LINEよりSignalを使うべき理由

LINEWhatsAppSignalはどれもE2E暗号化採用している。

しかし、Signalの方がLINEWhatsAppよりも安全である

 

まず、データ送信時に、メタデータ送信している。

メッセージの内容はエンドツーエンド暗号化によって保護されるが、LINEメタデータ保護しない。

まり第三者がその情報を知ることができる。

一方、Signalメタデータ保護している。

 

メッセージメタデータに加え、アプリスマホに保管されている情報収集できる。

LINEは、LINE海外拠点が、開発・運営業務上必要性からデータアクセスできる状態になっていたことについてユーザーへの説明不足が指摘されている。

一方、Signal電話番号のみを必要とする。その電話番号も、身元に関連づけることはない。

 

どの企業メッセージングサービスを所有しているか重要である

新生Zホールディングスは、LINEグループに加えたことで、ヤフーやその他のサービスとの業務連携を強化するとしている。これは個人情報の流用を示唆する。

一方、SignalSignal Technology Foundation社が所有している。ユーザー寄付運営される登記された非営利団体であるため、LINEよりはマシだろう。

 

LINESignalでは、安全メッセージングアプリを選ぶならSignalが断然良い。

2024-03-12

だいたいC2PAで対処かな

画像に関して言うなら、C2PAと言う、画像の来歴、改変の有無などを記録する規格ができつつあって、それで対処すると言うことのようだよ。

かにIPTCというものもある。(これは元々の目的ちょっと違うか)

で、主要カメラメーカーは参画してるし、スマホだとGoogleが参画しているので、Androidではデフォメタデータがつくようになるよね。

では、野良AIでつくられたやつはどうするかというと、AIで作られたかどうかを見破るAIというやつがあって、それなりの精度が出せてる。

インスタとかでAI生成画像をアップするとラベルがつくようになるらしい。

https://www.itmedia.co.jp/news/articles/2402/07/news087.html

anond:20240311183549

2024-01-25

anond:20240125170027

20年前の今頃は、配信のやつはいつ消えるかわからんって言ってたしその通りだったし、何より回線負担かけるのコストだったけど、今のサブスクからブツが消えるなんてほぼないと思うんだよな。

なんなら20年前ごろのデータ、音質悪いメタデータついてない癖に容量ばっかとって邪魔から、もういらん。

 

……と思うんだがどうかな。やはり合理的意味以上に所有したい気持ちが勝るだろうか。

2023-12-09

anond:20231209060413

SEOなんてWebで金稼ぎたいモンスターしかやらんわ

てかSEO対策って言葉なんか当たり前になっちゃってるけどおかしくね

SEO自体が(Webアップロードするhtml等の記述を)ーチジン適化(することで表示ランク上げる)って意味で、SEOで完結してるんだから

最適化対策をするとしたらGoogleとかのエンジニアがやることじゃん

対策って単語を入れるなら、SE対策、になるはずじゃね

だいたいそんなもんに頼らなくてもね、自力目的のページにたどり着ける知能がないと人間情報リテラシー最適化されていかないのよ

現に今あんたの経験値は1上がっただろ

そうやって全員が経験値稼いで実力をつけていくことのほうが大事なんだよ

なんでもかんでも相手がお誂え向きにデータを整え分類してくれてあると思っちゃダメ

インターネットってのは混沌としてて当然であるべきなの

秩序立てて分類することで利益を得ようとするエンジン勢力アップロード側が寄り添って、メタデータを充実させてやるのも悪いお節介ではないが

そういう自発的お節介依存してちゃダメなんだよ、現に利益を得ようって人しか熱心にやらないだろ、足並み揃えようがない

究極的には分類する側がひたすらマッチョに賢くなっていくしかないし、それによってSEOなんてもの不要になっていくべき

2023-12-05

anond:20231205103520

認識がズレてる。「メタ」とはある事象上位概念のことだと思ってる。

メタ認知=認知に対する認知」「メタデータ=データに対するデータ」といった具合。

元々対策するなんて意味なんかないはずなのに

ゲームシステムや個々のゲームプレイだけではなく、そこにいるプレイヤーたちの傾向を考えて対策するのが「メタ」なの。

というのは「メタ」の使い方がおかしいと思う。

2023-11-07

https://vaaaaaanquish.hatenablog.com/entry/2023/11/07/180723

Pythonパッケージにおいては正確なメタデータPyPI APIから返ってこない

これずーっとそうだよね

公式コメントは負荷がどうとかいうことになってるけど、前日分まではバッチで生成してCDNに、当日分だけサーバーで生成するとか如何様にも対策できるだろ

実際にはやりたくない事情があってやってないだけで

2023-08-23

WEB画像解像度は72dpiに設定すべきという幻想は捨てろ

Twitter映像畑の人による「映像系に使用する画像で72dpi以上は必要がなく、事前に整理するのが当然なんだけど350dpiのままで作業する人がいた。基本が抜けてるなぁ」といったツイートを偶然目にしてしまい、以下これに関してつらつらと書いていく。


結論から書くと、WEB画像解像度設定は72dpiだろうが350dpiだろうがなんでもよく、縦と横のピクセル数だけ見ていればよい。


DPIとは?>

印刷解像度設定」といったメタデータと考えてもらって構わない。

簡単説明すると、DPIとは、その画像をどれだけのキレイさで印刷するかという品質設定の単位である

dot per inchの略であり、1インチにどれだけドットを敷き詰めるかをこの数値で設定する。

72dpiは1インチあたりに72ドット、350dpiは1インチあたり350ドットドットの数が多いほど密度が上がるので鮮明に見える。

要はパソコンディスプレイ解像度と同じ。同じピクセル数の画像を72dpiの設定で印刷しようとすると大きく荒く出て、350dpiの設定で印刷すると小さくキレイに出る。

FHDの動画を27インチFHDモニターに等倍で再生すると全画面で再生されるが、27インチ4Kモニター場合、画質は良いが拡大しないと小さいウインドウ内で再生されるイメージとおおよその構造は一緒。

一般印刷用の画像データは350dpiにするのが理想とされている。

そのデータ映像制作使用する際に、解像度設定をそのままにしている人に対する嘆きが冒頭のツイートにつながったのだろう。


WEB画像におけるDPIPPI)>

DPIとは「印刷解像度設定」のことなので、デジタルで表示・使用する場合、この数値は関係がない。

というか、そもそもソフト側で参照されている様子がない。

まりDPIはどうでもよいのだ。

重要なのはピクセル数だ。1920×1080pxの画像があったとする。

解像度の設定を350から72dpiに変更したとする。

デジタル上でなにが変わるか。

なにも変わらないのである

画像の見た目も、容量も変わらない。カンバスサイズも変わらない。

実際に解像度の数値を変更した画像ブラウザで読み込んでみたところ、表示されるものは全て一様であった。

まり全く変わらないのである

なお、Photoshop上で解像度の数値を変更する際、設定によっては解像度の数値の増減に合わせて縦横のピクセル数も増えたり減ったり(拡大縮小)するので、それによって画像サイズが変わりはする。

ただそれはピクセル数の増減によってサイズが増減するということなので、例えば350dpiを72dpiにしたか画像が小さくなった、とは言えない。


ちなみにディスプレイ上ではDPIではなくPPIと呼ぶ。なぜならばDotではなくPixelから。どうでもいい話ではあるが。




そもそもディスプレイ解像度は>

72ppiじゃないよね。iPadは264ppiiPhoneは460ppiのものもあるよね。

モニターは、72ppi!」というのはあまりにいにしえの知識と言える。

さらに言うと、ppiは画面解像度と画面の物理的なサイズによって算出される。だってper inchだもん。

例えば4kモニターでも31インチなら142ppi20インチなら220ppiだ。同じ数ピクセルが詰まってるなら画面が小さい方が細かいでしょ。

というか、逆に言えば80インチ場合4Kと言ったって55ppiであるフルHDは28ppiだ。

ね、ppiのことを考えるのがどれだけ無駄か分かるでしょ。


映像制作においては>

最終的にエンコードする画面解像度、つまりフルHDなのか4Kなのかなどによって必要な素材のピクセル数は決まってくる。

からデカすぎる画像リサイズせよというのは分かる。

しかしそこにdpiだのppiだのといった数値はもはや関係がない。ピクセル数を削れという話なのだから

したがって、繰り返しになるがピクセル数だけ見ていればよい。

映像制作中においても、素材画像解像度設定が350だろうが72だろうが、画質になんの違いも出ない。

制作後も最終的にはエンコードをするので元素画像解像度設定はガチマジで関係がない。

素材データの受け渡しを考えても画像容量も変わらないので本当に意味がない。


まりWEB画像解像度設定は350dpiだろうが72dpiだろうがなんでもよく、縦と横のピクセル数だけ見ていればよい。

そして解像度設定の数値は画像の素性に一切の影響を与えない。

画像解像度設定の数値がバラバラだと先方にナメられるから、とかはガチで知らん。しょーもないと思う。

なんというか、基本を知らないなあと言っている側が昔の作法からアップデートできていないだけでしたっていうのを見て色々と考えてしまったものである

(もしなにか「いや違う!」といった指摘があったらください。)




  • 以下余談---------

<※IllustratorPhotoshopなどにおいては>

これらのソフト場合解像度設定の異なる同じ画像ドキュメント内に配置した場合、配置された画像の大きさ(縦横サイズ)に違いが出る。

なぜならばこれらは印刷を前提としたソフトであり、また、ドキュメント自体印刷解像度の設定がなされているかである





個人のこだわりの場合

なんとなくWEB画像場合は72にしないと気持ちが悪い、といった場合否定しないが、それはあくま個人のこだわりなのでそうしない人を基本が抜けてるとかう〜んとか言うのはやめた方がいいと思いました。

イラレ上で画像を拡大縮小してるのに元画像解像度を350dpiにするのにこだわるような意味のなさ。拡大縮小してる時点で解像度は変わってるし、印刷所でRIPときに均されるんだからさ※後述)


デジタルはわかった。結局印刷場合ってどうすればいいの?>

A4/350dpi必要ピクセル数が約W2890H4090pxなのでそれくらいで良いのでは。

ちなみになぜ350dpiが良いとされているかというと、これ以上解像度を増やしても人間の目にはあまり区別がつかないとされていたり、印刷機の性能の事情などによってそうなっている。

ポスターなどは150〜200dpi程度あれば十分とされる。デカものは近くで見ないし多少荒くて良いのだ。

抱き枕タペストリーなどもそれくらい。近くで見るものだけど、布自体の目が粗いのでデータ解像度を上げてもあまり意味がない。滲むし。

(布の種類にはよるが……)

ポスターも先述の通り解像度自体落とすので相対的ピクセル数は変わらずA1/150dpi場合約W3500H4960pxなので上記より少し増える程度。

抱き枕カバーのようにすごく縦長とかでもない限りざっくり縦横5000pxあればもう十分なのではと思う。


というか、素人場合印刷場合ピクセル数だけ見ていれば良いと思う。

実際に印刷されるデータ印刷所でRIPリップリッピング)といって、印刷データに変換されるんだけど、そのとき印刷解像度はあらかじめ印刷所で設定された数値に変換されることがほとんどだろう。

だって必要印刷解像度って印刷機の線数の2倍って言うし。ほらまた知らない単語が出てきた。入稿先の印刷機の線数なんて把握せずに解像度設定してるでしょ。普通は175lpiなんだって。LPI。Line per inchね。その2倍。だから350なんだね。知らないでしょ。だからいいんだよ。良きようにやってくれるんだから

A4なのかB5なのかとにかく出力サイズがわかっていて、それに十分なピクセル数が足りていれば良い。あと塗り足しね。

変に知識をつけて画像解像度350dpiしました! 仕上がりサイズはA4です!っていって縦横350pxみたいな画像が配置してあるデータ送られてきてもガビガビに印刷されるだけだよ。大事なのはピクセル数。覚えてこ。

2023-05-09

https://inside.pixiv.blog/2023/05/09/183635

白状すると、数日前にBot動かしてた(メタデータ収集目的であり画像収集目的ではない)けど、別に何にも引っ掛からなかったので、Bot Protectionもたかが知れてる感じはある

画像以外にはProtection掛けてない可能性もあるかもだが

2023-05-08

AI学習否定絵師ちゃんAI学習対策しているのか

AI学習否定派の神絵師様の証言が集まっていたので、ちゃんAI学習対策してるのか調べてみた。

https://www.itmedia.co.jp/news/articles/2305/08/news068.html

名前敬称略フォロワーPixivTwitterdanbooru
あかもく24非公開公開中takedown済
イコモチ64万非公開公開中takedown済
皐月13万非公開公開中転載済(58件)
黒須10非公開公開中転載済(218件)
霧月25万一部非公開公開中転載済(189件)


転載サイトまで対策しているのは5人中たったの2人しかいなかった。

件数記載しているように、転載サイトには作者タグがあるのでほんの数分で神絵師投稿して転載された作品数まで知ることができる。

そしてイラストメタデータはやたら充実している(anond:20230507074525)ので転載サイト学習してしまえば悪意のある絵柄模倣pixivだけ非公開にしようがハナクソほじるように簡単に実行できるだろう。

そもそもTwitterでもイラスト大公開しているので、アカウントと関連付けて学習するだけでもPixiv公開と似たようなAI学習効果はあるだろう。今すぐTwitterイラストを消すべきでは?

流言に流されてなんとなくの対策をしてる人が多く、半端で非常に残念としかいいようがない。

転載対策をしない限りTwitterイラストアップしてる時点でPixivを非公開にしようが関係なく転載され続ける。Twitterだけでも学習できるけど。

ちなみに転載海外サイトで行われてるので最強の盾「フェアユース」が壁になってるから開き直られたら対策不能danbooruクリエイターの依頼で非公開対応してくれるので比較的優しいサイトではある。

今のフォロワー数で十分に仕事が来て、絵柄の模倣が損になる神絵師はこういった非公開対応をする価値があるが、

フォロワーやすべく活動しないといけないTier2のイラストレーターたちは転載AI模倣に嫌な思いをしつつも

Twitter活動し続けないといけない地獄環境といっていいだろう。

2023-05-07

anond:20230507133327

いわゆる国産P2Pソフトと違ってBitTorrentあくまでも通信プロトコルしかないので…

歯抜けが多すぎる。

国産P2Pも大差がない(古いファイル・人気がないファイルでは歯抜けが普通に起こる)

検索機能がない。

ピア間でメタデータをやり取りして検索できるような実装になっているBTクライアント(BitCometなど)もある。

ラッカーサイトが乱立して不便。

RSSでいーじゃん

アップロード絞りをするフリーライダー対策がない。

会員制トラッカーサイトでは共有比による監視が行われていてフリーライダーダウンロードできなくなるし、最悪サイトから蹴り出されるよ。

Pixiv投稿するとAI絵に学習されるというデマ

アンチAIの人はAI使ったことないからよく分かってないみたいだけど、

Pixiv自体AIにとって話にならないんだよね。学習の参考にならないから。

Pixivの次にヤバいのがTwitterなんだけど、まさかアンチAIなのにTwitterイラストアップしてるマヌケだったりしないよな?

https://b.hatena.ne.jp/entry/s/twitter.com/tadanojako/status/1654676274089197568

AI学習する上で一番重要なのはメタデータの質なので、最近2次元AIは黙って転載サイトdanbooruとか使ってるよ?

danbooru転載元として多いのはPixivTwitterなのでPixiv云々は致命的に間違ってるわけでもないのだが。

本気でアンチAIならTwitterに一切のイラスト投稿しないで活動しないといけないので、

人々に見て貰いフォロワーを増やすことで仕事に繋げるイラストレーターとしては自殺しか無いと思うけど、思想信条問題なら仕方ないかな。

転載サイトトップで見かけたピーチ姫だが、投稿されたPixiv転載先のdanbooruメタデータの差は圧倒的でどちらから学習したほうが精度が高くなりそうかはバカでも理解やすいだろう。

https://www.pixiv.net/artworks/107888278

https://danbooru.donmai.us/posts/6286948

Pixiv

#スーパーマリオ #ピーチ姫

danbooru

#mario (series)

#super mario odyssey

#princess peach

#1girl

#blonde hair

#blue eyes

#breasts

#day

#earrings

#from above

#hat

#high heels

#jewelry

#large breasts

#lips

#long hair

#long skirt

#looking at viewer

#open mouth

#outdoors

#pink lips

#pink skirt

#shirt

#skirt

#smile

#solo

#sun hat

#white headwear

#white shirt

pixiv転載サイトなんとかしてくれという要望なら理解できるのだが、Pixiv悪者にしたら回避できると頭の悪い学習をしてしまっているようだ。

Pixiv規約スクレイピング禁止でも転載され放題な現状なので。

よくわからない第三のイラスト投稿サイト()とやらがスクレイピング禁止してもイラストが集まるなら転載サイト無視してくるよ。

2023-04-25

本格なAIアイドル中の人のいないVTuberAITuber)が出てくると、それは空っぽの抜け殻なのか、本質なのか。

ウマ娘のような擬人化コンテンツにせよ、VTuberにせよ、近年の特徴は「メタ」、情報ナラティブの付加や、一歩俯瞰した外側から眺めることで、情報量の増加と奥行きを楽しむものだったように思える。

AITuberはメタを取り払った中身だけの存在か、メタデータそのもの人間性の皮膜を俯瞰して楽しむものなのか。

2023-04-08

anond:20230405152609

SSDデータ復元も試してみた?

SDカードにはメタデータくらいしか残ってなくてもSSDの容量次第では上書きされてないかもよ

ログイン ユーザー登録
ようこそ ゲスト さん
Лучший частный хостинг