これそうとうやばいんじゃないかという気がしている。
俺はあくまで、機械学習の原理とか知ってる程度の、詳しい素人レベルだけども。
アルゴリズムが単純になって、同時に複数の問題が解決してる
- データを流したまますぐに学習が可能→ビデオ映像のストリームをそのまま流して、そのまま学習ができる
- 教師データの問題の解決。数字判別のモデルなのは0~9のどれかで、「数字じゃない画像」の判別が難しかった。それが認識できるアルゴリズムになっているし、このアルゴリズムで学習させるための「数字じゃないデータ」を用意するための単純な方法がある
- アルゴリズムが単純なため、この処理内の計算が「微分可能」という成約が不要になってる。(いままでの手法だと、微分不可能なパスが含まれていると、どうしても学習ステップが遅くなる)
- 電力効率がいい 後ろから前に計算してくだけなので、専用のアナログ回路で設計でき、電力効率が良いとのこと
深層学習とかのめちゃくちゃ基本の誤差逆伝播法を発明したヒントンって人が、それを置き換える新しい学習するアルゴリズムを発表してるんだけど
https://twitter.com/martin_gorner/status/1599755684941557761
この記事(OpenAIの説明を改めて説明してくれた)を読むだけでも、特性が分かるので、質問の投げ方を多少気をつければ、現状のchatGPTでも有用な使いかたがあるというのは分かるな
https://zenn.dev/ttya16/articles/chatgpt20221205
chatGPTはGPT-3.5のモデルから、人間が適切だと思うような回答を混ぜ込みながら更に調整する強化学習をつかって、安全な回答をするようになったっぽい。なるほど
元のGPT3.5や、追加の強化学習のどちらにも、情報が真実かどうかの判定ソースが無いから、不正確になる
常識的に考えて当たり前のことは人間の評価者はモデルには明示的には教えることはないため、モデルは前提を理解しないまま人間の評価者を真似ることを覚えるため、前提が成立しない時には間違ったことをやってしまう恐れがある。
回答内容が多少助長で、特定のフレーズを協調しがち
これは学習データにおけるバイアスによるもので、人間の評価者は包括的な長い回答を好む傾向にあったことに由来する。
これからの大規模言語モデルAIの到来と、それを利用できる我々として、やるべきこと。
仕事への活用
- プログラマは、活用するレバレッジがかなり直接的ででかい。早急にノウハウを溜め込むこと。
- これは、イラストレータが3ヶ月前くらいに直面してた
「プログラミング」「小説、TRPG、物語」といった、応用分野を、他にも見つけて調べること
プログラミング分野と近いところで、プロダクトマネジャーの相談とかの使用例もあった
AI対話基礎、なる分野をまとめること
例
- わかりやすい文章を書く
- 小さい粒度に分ける
- 指示の動詞を隠さない
- 特殊なクエリの出し方で、変わったモードに遷移させられるので、そのモードの調査
- 対話の往復を効率化するような指示の出し方
現状のAIでできないことを把握すること
「理解するとはどういうことか?」ということを我々が理解すること。対話を使ってその境界を把握する必要がある
などと、さっと思いつく限りでもこれほどある
もやみん