• 株式会社ずんだもん技術室AI放送局 podcast 20240626

  • 2024/06/25
  • 再生時間: 1分未満
  • ポッドキャスト

『株式会社ずんだもん技術室AI放送局 podcast 20240626』のカバーアート

株式会社ずんだもん技術室AI放送局 podcast 20240626

  • サマリー

  • 関連リンク
    • Claude 3.5 “Sonnet” 公開、GPT-4oに匹敵する性能かつ低価格を謳う

    Claude 3.5 “Sonnet” は、Anthropicが開発した新しい大規模言語モデルです。GPT-4oに匹敵する性能を持ちながら、低価格で提供されるとされています。Sonnetは、コード生成、文章作成、翻訳など、幅広いタスクで優れた性能を発揮します。詳細な情報や使い方については、記事の原文を参照してください。

    引用元: https://techfeed.io/entries/6679e25a4b9f927310ebb7de

    • [Detecting hallucinations in large language models using semantic entropyNature](https://www.nature.com/articles/s41586-024-07421-0)

    本論文では、大規模言語モデル(LLM)における「幻覚」と呼ばれる、根拠のない誤った出力や不確かな回答を検出するための新しい手法が提案されています。従来の手法では、LLMの出力の単語やフレーズの確率を基に、出力の信頼性を評価していました。しかし、同じ意味を表す文章は、単語やフレーズが異なっても、意味的には同じであるため、従来の手法では、正しい回答が複数存在する場合に、誤って信頼性が低いと判断されてしまう可能性がありました。

    そこで本論文では、LLMの出力が表す意味の「セマンティック・エントロピー」を導入することで、この問題を解決しています。セマンティック・エントロピーは、LLMの出力を、意味的に同じ文章のグループに分類し、そのグループの確率分布に基づいて計算されます。意味的に同じ文章は、単語やフレーズが異なっても、同じグループに分類されるため、従来の手法よりも、正しい回答を正しく評価することができます。

    本論文では、この手法を用いて、LLMにおける「幻覚」を検出する実験を行っています。その結果、この手法は、従来の手法よりも、LLMの誤った回答を高い精度で検出できることが示されています。また、この手法は、LLMの回答の信頼性を評価するだけでなく、LLMが信頼性の低い回答を生成する可能性が高い質問を識別することにも役立つことが示されています。

    この手法は、LLMの信頼性を向上させるための重要なツールとなり、LLMの応用範囲を拡大する可能性を秘めています。

    引用元: https://www.nature.com/articles/s41586-024-07421-0

    • [プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー)テクノエッジ TechnoEdge](https://www.techno-edge.net/article/2024/06/24/3488.html)

    今週話題になった生成AI技術を5つ紹介します。Anthropicは、各種ベンチマークでClaude 3 OpusやGPT-4を上回る性能を持つ最新の大規模言語モデル「Claude 3.5 Sonnet」をリリースしました。動画生成AIでは、RunwayがGen-2よりも忠実度やモーションが向上した「Gen-3 Alpha」を発表しました。国内では、カラクリ株式会社が国産LLMとして初めてFunction callingとRAGに対応した「KARAKURI LM 8x7B Instruct v0.1」を発表しました。オープンソースの動画生成AI「Open-Sora 1.2」は、ビデオ圧縮ネットワークを導入することで、動画の品質を維持しながらトレーニングコストを削減しました。3Dメッシュ生成分野では、写真1枚からプロが作ったような高品質な3Dモデルを生成する「Unique3D」と、点群や3D GSなど様々な3D表現から高品質なメッシュを生成する「MeshAnything」が注目されています。

    引用元: https://www.techno-edge.net/article/2024/06/24/3488.html

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示

あらすじ・解説

関連リンク
  • Claude 3.5 “Sonnet” 公開、GPT-4oに匹敵する性能かつ低価格を謳う

Claude 3.5 “Sonnet” は、Anthropicが開発した新しい大規模言語モデルです。GPT-4oに匹敵する性能を持ちながら、低価格で提供されるとされています。Sonnetは、コード生成、文章作成、翻訳など、幅広いタスクで優れた性能を発揮します。詳細な情報や使い方については、記事の原文を参照してください。

引用元: https://techfeed.io/entries/6679e25a4b9f927310ebb7de

  • [Detecting hallucinations in large language models using semantic entropyNature](https://www.nature.com/articles/s41586-024-07421-0)

本論文では、大規模言語モデル(LLM)における「幻覚」と呼ばれる、根拠のない誤った出力や不確かな回答を検出するための新しい手法が提案されています。従来の手法では、LLMの出力の単語やフレーズの確率を基に、出力の信頼性を評価していました。しかし、同じ意味を表す文章は、単語やフレーズが異なっても、意味的には同じであるため、従来の手法では、正しい回答が複数存在する場合に、誤って信頼性が低いと判断されてしまう可能性がありました。

そこで本論文では、LLMの出力が表す意味の「セマンティック・エントロピー」を導入することで、この問題を解決しています。セマンティック・エントロピーは、LLMの出力を、意味的に同じ文章のグループに分類し、そのグループの確率分布に基づいて計算されます。意味的に同じ文章は、単語やフレーズが異なっても、同じグループに分類されるため、従来の手法よりも、正しい回答を正しく評価することができます。

本論文では、この手法を用いて、LLMにおける「幻覚」を検出する実験を行っています。その結果、この手法は、従来の手法よりも、LLMの誤った回答を高い精度で検出できることが示されています。また、この手法は、LLMの回答の信頼性を評価するだけでなく、LLMが信頼性の低い回答を生成する可能性が高い質問を識別することにも役立つことが示されています。

この手法は、LLMの信頼性を向上させるための重要なツールとなり、LLMの応用範囲を拡大する可能性を秘めています。

引用元: https://www.nature.com/articles/s41586-024-07421-0

  • [プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー)テクノエッジ TechnoEdge](https://www.techno-edge.net/article/2024/06/24/3488.html)

今週話題になった生成AI技術を5つ紹介します。Anthropicは、各種ベンチマークでClaude 3 OpusやGPT-4を上回る性能を持つ最新の大規模言語モデル「Claude 3.5 Sonnet」をリリースしました。動画生成AIでは、RunwayがGen-2よりも忠実度やモーションが向上した「Gen-3 Alpha」を発表しました。国内では、カラクリ株式会社が国産LLMとして初めてFunction callingとRAGに対応した「KARAKURI LM 8x7B Instruct v0.1」を発表しました。オープンソースの動画生成AI「Open-Sora 1.2」は、ビデオ圧縮ネットワークを導入することで、動画の品質を維持しながらトレーニングコストを削減しました。3Dメッシュ生成分野では、写真1枚からプロが作ったような高品質な3Dモデルを生成する「Unique3D」と、点群や3D GSなど様々な3D表現から高品質なメッシュを生成する「MeshAnything」が注目されています。

引用元: https://www.techno-edge.net/article/2024/06/24/3488.html

  • お便り投稿フォーム

(株式会社ずんだもんは架空の登場組織です)

株式会社ずんだもん技術室AI放送局 podcast 20240626に寄せられたリスナーの声

カスタマーレビュー:以下のタブを選択することで、他のサイトのレビューをご覧になれます。