lynx   »   [go: up one dir, main page]

記事へのコメント61

  • 注目コメント
  • 新着コメント
tach
「LLMはトークンのパターンマッチング予測アルゴリズムであり、理解や推論が可能な『知能』ではない」と説明しても中々理解して貰えない事が多い。その無理解がAIのとんでもない誤用に繋がりそうで怖い

その他
misshiki
“「what is the number of r s in strawberry」と質問しました。...以下の画像でChatGPTは「The word ”strawberry” contains 2 “r”s」と回答しています。”

その他
deep_one
ストロベリーという単語に含まれるrの数、で間違う…/LLMは「インターフェイス」を担うものであって「処理」を担うものじゃないと思っている。

その他
ysync
「LLMはトークンのパターンマッチング予測アルゴリズムであり、理解や推論が可能な『知能』ではない」まぁ今のアプローチではシンギュラリティは来ないよね。

その他
cupeytan
“LLMはトークンのパターンマッチング予測アルゴリズムであり、理解や推論が可能な『知能』ではないことが示されています”

その他
waot209
今のAIはアップデートされて解けると言ってる人もいるけど、もし有名な問題に対応しているだけなら賢くなっているとは言い難い。IQテストを練習して点数を上げても本質的な知能が上がったことにはならないのと同じ。

その他
tomaho
"すももももももももものうち"のうち、も、は何文字ある?は、当然かもしれないけどo1-previewでも失敗した。まぁ答えが一意に決まるもの(確率ではないもの)はLLMには向かないですよね

その他
tockri
Claudeに"what is the number of r s in strawberry"って質問したらちゃんと3って答えたので速攻で克服されたんじゃない。やっぱすげえなAIさん。

その他
sds-page
10回クイズみたいなもんだよね。人間の脳も油断するとパターンマッチングで答えてる

その他
otoan52
"「what is the number of r s in strawberry(ストロベリーという英単語に、『r』は何個含まれるか)」と質問しました" 「文字列の画像を生成」→「画像を見てrを数える」という手順なら多分失敗しない。適切な手順の生成が必要。

その他
blueboy
これはただの「粗探し」だ。アラを見つけたとしても、例外的な穴があったというだけだ。完璧性が必要な防護壁じゃないので、満点を取る必要はない。「あ、そう」と無視すればいいだけ。解決してもさして意味はない。

その他
quwachy
いつの記事だよ、まさにその問題を解決するための技術が通称プロジェクトstrawberry、製品名だとOpenAI o1 トランスフォーマー+強化学習で解決できることがすでに立証済み

その他
filinion
5年くらい前には、「AIにはソーティングができない」って言われてたんだよ。こんな問題もすぐ克服されるんじゃないかしら。研究者にとっては興味深いだろうけど、ユーザーにとってはあんまり意味がないような。

その他
dgen
学習してないものは答えられないだけ。バナナの例だと逆に過学習の可能性もある。

その他
lochtext
pythonでやれば正解できるのは大したものだよ

その他
ebibibi
確かにGPT-4oでは再現した。そしてGPT-o1-previewは正解した。

その他
aneet
o1の正式版はよ、アップルに言われた余計な情報を付け加えると正答率が下がる方も解決して欲しい。

その他
hatebu_ai
hatebu_ai 「ヒザヒザヒザヒザヒザヒザ(深層学習)」「じゃあここは?」「女性の股間から生える男根」「なんでやねん!!!」

2024/10/20 リンク

その他
yarumato
“単語によっては「straw」「berry」という2つのトークンを組み合わせる形で入力を取り込んでいる場合もある。トークンを扱うLLMベースのAIは、単語をアルファベット単位で分解することは難しいといえます。”

その他
hinonono
パターンマッチング予測も、これまで機械にできなかった知能そのものでは…?/強化学習やo1などの追加部分が大きくて、もうパターンマッチング予測だとか統計的な関連性だとか単純な説明で済む領域から外れとるじゃろ

その他
gewaa
gewaa 「サカナクションを逆さまから読んで」とo1-previewに命令してみたら「ンョクナカサ」と微妙に間違えていた。1文字単位の認識はまだ苦手な模様。AIを見破るのに使える。

2024/10/20 リンク

その他
Helfard
BingでCopilotに聞いたら普通に正解するので良く分からん。

その他
napsucks
日本語の場合は単語ではなく1文字をトークンとして学習してると聞いた気がするが、実際は引っ掛かるのよね。今のAIは将棋で言うところの評価関数のみで回答しており探索をしてない感じがするのでo1以降に期待だね。

その他
cu39
Claude 3に「英語で苺を表す名詞を最初から1文字ずつ調査し、rの文字が現れるたび数を数え、最後まで調査したあとその合計を伝えてください」と指示したらちゃんと数えられた。ちょっとかわいい。

その他
ya--mada
名前が付くほどの現象だったの?当たり前のことかと思っていた。ChatGPT-4oでpythonでコード書いて同じ処理をしろって命令するとちゃんとカウントするけど、出来る限りコードを書かずに当てずっぽうに答える省エネをやる

その他
colonoe
こういう問題は有名になると対策されるので性能テストとしては役に立たなくなるんだよね。だから新しい質問を用意しないといけないので大変

その他
maguro1111
maguro1111 本当だ、試したらo1-previewは克服してる。しかも存在しない単語(適当な文字列)でも正しく数えてる。どうやってんだろ

2024/10/20 リンク

その他
curuusa
curuusa 人間もこんな感じで間違えやすい→「いっぱいの4文字のうち、いをおに変えると何になる?」「おっぱい」「正解はおっぱお」「おっぱい!おっぱい!」「いやだから正解は」「おっぱい!おっぱい!」「おっぱい!おっ

2024/10/20 リンク

その他
e_denker
バナナだのイチゴだの!

その他
Nekzuk
Nekzuk トップブコメ:Chatgpt-o1ってあまり騒がれてないけど計測によるとIQ120相当あるらしいからな.....単純な計算量のかさ増しでなくシステム構造(段階的な推量構造)にしたことが効いているのかもしれない

2024/10/20 リンク

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?

大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特...

ブックマークしたユーザー

すべてのユーザーの
詳細を表示します

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

Лучший частный хостинг