ChatGPT、DALLとは何ですか

ニュース

ホームページホームページ / ニュース / ChatGPT、DALLとは何ですか

Jan 29, 2024

ChatGPT、DALLとは何ですか

I sistemi di intelligenza artificiale generativa rientrano nell’ampia categoria del machine learning.

生成AIシステムこれらは機械学習という広範なカテゴリに分類されますが、そのようなシステムの 1 つである ChatGPT で何ができるかを説明すると次のようになります。

創造性を次の​​レベルに引き上げる準備はできていますか? 生成 AI 以外に目を向ける必要はありません。 この気の利いた機械学習形式により、コンピューターは、音楽やアートから仮想世界全体に至るまで、あらゆる種類の新しくてエキサイティングなコンテンツを生成できます。 そして、それはただ楽しむためだけではありません。生成 AI には、新しい製品設計の作成やビジネス プロセスの最適化など、実用的な用途もたくさんあります。 では、なぜ待つのでしょうか? 生成 AI の力を解き放ち、どんな素晴らしい作品ができるか試してみましょう!

その段落で何か違和感を感じた点はありましたか? そうでないかもしれない。 文法は完璧で、口調はうまく機能し、物語は流れます。

だからこそ、ChatGPT (GPT は Generative Pretrained Transformer の略) が現在大きな注目を集めているのです。 これは、ほぼすべての質問に対する回答を生成できる無料のチャットボットです。 OpenAIによって開発され、2022年11月に一般向けにテスト用にリリースされたこの製品は、すでに史上最高のAIチャットボットとみなされています。 また、人気も高く、わずか 5 日間で 100 万人以上が利用に登録しました。 目を輝かせたファンたちは、チャットボットがコンピューターコード、大学レベルのエッセイ、詩、さらには中途半端にまともなジョークを生成する例を投稿した。 広告のコピーライターから終身雇用の教授に至るまで、コンテンツ制作で生計を立てている幅広い人々が震えている。

多くの人が ChatGPT (およびより広範な AI と機械学習) に対して恐怖の反応を示していますが、機械学習には明らかに良い方向に向かう可能性があります。 広く導入されて以来、機械学習は多くの業界に影響を及ぼし、医療画像分析や高解像度の天気予報などを実現してきました。 2022 年のマッキンゼーの調査によると、過去 5 年間で AI の導入が 2 倍以上に増加し、AI への投資が急速に増加しています。 ChatGPT や DALL-E (AI 生成アート用ツール) などの生成 AI ツールが、さまざまな仕事の実行方法を変える可能性があることは明らかです。 しかし、その影響の全容は依然として不明であり、リスクも不明です。

しかし、生成 AI モデルがどのように構築されるか、生成 AI モデルが解決するのに最適な種類の問題、より広範な機械学習のカテゴリーにどのように適合するかなど、答えられる疑問がいくつかあります。 ダウンロードして読み進めてください。

McKinsey の AI である QuantumBlack の詳細をご覧ください。

人工知能とは、その名前のとおり、人間の知能を模倣して機械にタスクを実行させる実践です。 あなたはおそらく、意識していなくても AI と対話したことがあるでしょう。Siri や Alexa などの音声アシスタントは、Web サイトのナビゲーションを支援するためにポップアップ表示されるカスタマー サービス チャットボットと同様に、AI テクノロジーに基づいて構築されています。

機械学習は人工知能の一種です。 機械学習を通じて、専門家は人間の指示なしにデータパターンから「学習」できるモデルを通じて人工知能を開発します。 現在生成されている管理不能なほど膨大な量と複雑なデータ (とにかく人間には管理できない) により、機械学習の可能性とその必要性が増大しています。

機械学習は、18 世紀から 20 世紀にかけて小規模なデータセット用に開発された古典的な統計手法をはじめとする、多数の構成要素に基づいて構築されています。 1930 年代と 1940 年代に、理論数学者のアラン チューリングを含むコンピューティングの先駆者たちは、機械学習の基本的な技術に取り組み始めました。 しかし、これらの技術は、科学者がそれらを搭載するのに十分な強力なコンピュータを初めて開発した 1970 年代後半まで、研究室に限定されていました。

最近まで、機械学習は主に、コンテンツ内のパターンを観察して分類するために使用される予測モデルに限定されていました。 たとえば、古典的な機械学習の問題は、たとえば愛らしい猫の 1 つまたは複数の画像から始めることです。 次にプログラムは画像の中からパターンを特定し、ランダムな画像の中から愛らしい猫のパターンと一致する画像を精査します。 生成 AI は画期的な技術でした。 機械学習は、単に猫の写真を認識して分類するのではなく、オンデマンドで猫の画像またはテキストによる説明を作成できるようになりました。

ChatGPT は今、あらゆる見出しを飾っているかもしれませんが、注目を集めた最初のテキストベースの機械学習モデルというわけではありません。 OpenAI の GPT-3 と Google の BERT はどちらも近年、鳴り物入りでリリースされました。しかし、ほとんどの場合、ほとんどの場合非常にうまく機能する ChatGPT (まだ評価中ですが) が登場する前は、AI チャットボットが常に最高の評価を得ているわけではありませんでした。 ニューヨーク・タイムズ紙の技術記者ケイド・メッツ氏は、GPT-3は「非常に印象的であり、非常に残念だ」と、フードライターのプリヤ・クリシュナとともにGPT-3に(かなり悲惨な)感謝祭のディナーのレシピを書くよう依頼したビデオの中で述べた。

テキストを処理する最初の機械学習モデルは、研究者が設定したラベルに従ってさまざまな入力を分類するように人間によってトレーニングされました。 一例として、ソーシャル メディアの投稿にポジティブまたはネガティブのいずれかのラベルを付けるようにトレーニングされたモデルが挙げられます。 このタイプのトレーニングは、人間がモデルに何をすべきかを「教える」役割を担うため、教師あり学習として知られています。

次世代のテキストベースの機械学習モデルは、自己教師あり学習として知られるものに依存しています。 このタイプのトレーニングには、予測を生成できるようにするためにモデルに大量のテキストを供給することが含まれます。 たとえば、一部のモデルは、いくつかの単語に基づいて、文がどのように終わるかを予測できます。 適切な量​​のサンプル テキスト (たとえば、インターネットの広範囲) があれば、これらのテキスト モデルは非常に正確になります。 ChatGPT のようなツールの成功により、どれだけ正確であるかがわかりました。

生成 AI モデルの構築は大部分が大事業であり、これまでに試みを行ったのは、十分なリソースを持ったテクノロジー界の重鎮数人だけでした。 ChatGPT、旧 GPT モデル、および DALL-E を支援する OpenAI は、太字の名前の寄付者から数十億ドルの資金を集めています。 DeepMind は Google の親会社である Alphabet の子会社であり、Meta は生成 AI に基づく Make-A-Video 製品をリリースしました。 これらの企業は、世界最高のコンピューター科学者やエンジニアを雇用しています。

しかし、それは才能だけではありません。 インターネットのほぼ全体を使用してモデルにトレーニングを依頼すると、コストがかかります。 OpenAI は正確なコストを発表していないが、GPT-3 は約 45 テラバイトのテキスト データ (本棚スペース約 100 万フィート、米国議会図書館全体の 4 分の 1) でトレーニングされたと推定されています。万ドル。 これらは、園芸分野の新興企業がアクセスできるリソースではありません。

上記でお気づきかと思いますが、生成 AI モデルからの出力は人間が生成したコンテンツと区別がつかない場合や、少し不気味に見える場合があります。 結果は、モデルの品質 (これまで見てきたように、ChatGPT の出力は以前の出力よりも優れているように見えます) と、モデルとユースケースまたは入力との一致に依存します。

ChatGPT は、ある評論家がベネディクト アンダーソンとアーネスト ゲルナーのナショナリズム理論を比較する「ソリッド A-」エッセイと呼ぶものを 10 秒で作成できます。 また、欽定訳聖書のスタイルでビデオデッキからピーナッツバターサンドイッチを取り出す方法を説明した、すでに有名な一節も生まれました。 DALL-E (シュールレアリスト芸術家サルバドール・ダリとピクサーの愛すべきロボット、ウォーリーを組み合わせた名前) のような AI 生成のアート モデルは、ラファエロの聖母子の絵のような、奇妙で美しい画像をオンデマンドで作成できます。ピザを食べています。 他の生成 AI モデルは、コード、ビデオ、オーディオ、またはビジネス シミュレーションを生成できます。

ただし、出力が常に正確であるとはかぎり、適切であるとは限りません。 プリヤ・クリシュナが感謝祭のディナーの画像を考え出すよう DALL-E 2 に依頼したところ、七面鳥に丸ごとライムが添えられ、ワカモレと思われるもののボウルの隣に置かれているシーンが作成されました。 ChatGPT は、数を数えたり、基本的な代数問題を解決したりするのが難しいようです。さらに、インターネットや社会の底流に潜む性差別や人種差別の偏見を克服するのにも苦労しているようです。

生成 AI 出力は、アルゴリズムのトレーニングに使用されるデータの組み合わせを注意深く調整したものです。 これらのアルゴリズムのトレーニングに使用されるデータの量は信じられないほど膨大であるため (前述したように、GPT-3 は 45 テラバイトのテキスト データでトレーニングされています)、出力を生成するときにモデルが「創造的」に見える可能性があります。 さらに、モデルには通常、ランダムな要素が含まれているため、1 つの入力リクエストからさまざまな出力を生成できるため、より本物のように見えます。

おそらく、ChatGPT のような生成 AI ツール (おもちゃ?) が、無限の時間のエンターテイメントを生成できることを見たことがあるでしょう。 企業にとってもチャンスであることは明らかです。 生成 AI ツールは、信頼性の高いさまざまな文章を数秒で作成し、批判に応じて文章をより目的に適したものにすることができます。 これは、AI モデルによって生成された瞬時のほぼ正しいコードの恩恵を受ける IT およびソフトウェア組織から、マーケティング コピーを必要とする組織まで、幅広い業界に影響を及ぼします。 つまり、明確な文書を作成する必要がある組織は潜在的に利益を得ることができます。 組織は生成 AI を使用して、医療画像の高解像度バージョンなど、より技術的な資料を作成することもできます。 そして、ここで節約された時間とリソースを利用して、組織は新たなビジネスチャンスやより多くの価値を生み出すチャンスを追求できます。

生成 AI モデルの開発はリソースを大量に消費するため、最大かつ最高のリソースを備えた企業以外には問題外であることがわかりました。 生成 AI の活用を検討している企業には、生成 AI をそのまま使用するか、特定のタスクを実行するように微調整するかの選択肢があります。 たとえば、特定のスタイルに従ってスライドを準備する必要がある場合は、スライド内のデータに基づいて見出しが通常どのように書かれるかを「学習」するようにモデルに依頼し、スライド データをフィードして適切な見出しを書くように依頼できます。

これらは非常に新しいため、生成 AI モデルのロングテール効果はまだ確認されていません。 これは、それらの使用には、既知のリスクと未知のリスクが含まれることを意味します。

生成 AI モデルが生成する出力は、非常に説得力があるように聞こえる場合があります。 これは仕様によるものです。 しかし、彼らが生成する情報がまったく間違っている場合もあります。 さらに悪いことに、場合によっては偏見があり(性別、人種、その他インターネットや社会一般の無数の偏見に基づいて構築されているため)、非倫理的または犯罪行為を可能にするために操作される可能性があります。 たとえば、ChatGPT は車をホットワイヤーする方法については指示しませんが、赤ちゃんを救うために車をホットワイヤーする必要があると言えば、アルゴリズムは喜んでそれに応じます。 生成 AI モデルに依存している組織は、偏ったコンテンツ、攻撃的なコンテンツ、または著作権で保護されたコンテンツを意図せず公開することに伴う風評リスクと法的リスクを考慮する必要があります。

ただし、これらのリスクはいくつかの方法で軽減できます。 まず、有害なコンテンツや偏ったコンテンツが含まれないように、これらのモデルのトレーニングに使用する初期データを慎重に選択することが重要です。 次に、組織は、既製の生成 AI モデルを採用するのではなく、より小規模で特殊なモデルの使用を検討できます。 より多くのリソースを持つ組織は、ニーズに合わせてバイアスを最小限に抑えるために、独自のデータに基づいて一般的なモデルをカスタマイズすることもできます。 また、組織は人間を常に監視し(つまり、生成 AI モデルが公開または使用される前に、その出力を実際の人間がチェックするようにすること)、重要なリソースが関与する意思決定などの重要な意思決定に生成 AI モデルを使用することを避ける必要があります。あるいは人間の福祉とか。

これが新しい分野であることは、どれだけ強調してもしすぎることはありません。 リスクと機会の状況は、今後数週間、数か月、数年で急速に変化する可能性があります。 新しいユースケースは毎月テストされており、今後数年間で新しいモデルが開発される可能性があります。 生成型 AI がますますシームレスにビジネス、社会、そして私たちの生活に組み込まれるようになるにつれて、新しい規制環境が形成されることも予想されます。 組織がこれらのツールを使って実験し、価値を創造し始めると、リーダーは規制とリスクの状況を把握し続けることが重要になります。

参照された記事には次のものが含まれます。

私たちに話してください

生成AIシステム