TT AI Log

人工知能 / AI / 脳機能解析 に関する「個人」の調査・研究・参照ログ

大規模言語モデル / LLM / Large-Scale Language Model

GPT-4 (まとめ)

【ニュース】 ◆OpenAIのGPT-4はCVEのセキュリティ勧告を読むことで実際の脆弱性を悪用できることが明らかに (Gigazine, 2024/04/22 14:08) https://gigazine.net/news/20240422-gpt-4-craft-attacks-based-chip-vulnerabilities/ ⇒ https://tt-ai.hatenablog…

Command R+ (まとめ)

【要点】 ◎Cohere が開発したオープンソースの大規模言語モデル(LLM)。2024/04/04に公開 【サイト】 ◆Command R+ (Cohere) https://docs.cohere.com/docs/command-r-plus ◆Hugging Faceから利用 (HuggingFace) https://huggingface.co/spaces/CohereForAI/…

Databricksがオープンな大規模言語モデル「DBRX」をリリース、GPT-3.5やCodeLLaMA-70Bを上回る性能

【ニュース】 ◆Databricksがオープンな大規模言語モデル「DBRX」をリリース、GPT-3.5やCodeLLaMA-70Bを上回る性能 (Gigazine, 2024/03/28 11:45) https://gigazine.net/news/20240328-dbrx-open-llm-databricks/

OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道

【ニュース】 ◆OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道 (Gigazine, 2024/03/21 10:46) https://gigazine.net/news/20240321-gpt-5-rumor/ 【関連まとめ記事】◆全体まとめ ◆AI企業 (まとめ) ◆OpenAI (まとめ) ◆GPT-5 (まとめ)…

EagleX (まとめ)

【ニュース】 ◆英語やその他言語の処理でLlama-2を超えたAIモデル「EagleX」がオープンソースで登場 (Gigazine, 2024/03/19 23:00) https://gigazine.net/news/20240319-eaglex-1-7t/ ⇒ https://tt-ai.hatenablog.com/entry/2024/03/19/000000 【関連まとめ…

英語やその他言語の処理でLlama-2を超えたAIモデル「EagleX」がオープンソースで登場

【ニュース】 ◆英語やその他言語の処理でLlama-2を超えたAIモデル「EagleX」がオープンソースで登場 (Gigazine, 2024/03/19 23:00) https://gigazine.net/news/20240319-eaglex-1-7t/ 【関連まとめ記事】◆全体まとめ ◆生成AI / ジェネレーティブAI (まとめ) …

なぜ大規模言語モデル(LLM)はだまされやすいのか?

【ニュース】 ◆なぜ大規模言語モデル(LLM)はだまされやすいのか? (Gigazine, 2024/02/24 10:00) https://gigazine.net/news/20240224-llm-gullible/

LLMがWebサイトを自動ハッキング 研究者らが各LLMの性能を比較

【ニュース】 ◆LLMがWebサイトを自動ハッキング 研究者らが各LLMの性能を比較 (ITmedia, 2024/02/21 11:30) 最新の研究でLLMがWebサイトを自動的にハッキングできることが明らかになった。自律的なWebサイトハッキングの可能性が実証され、防御と攻撃のバラ…

ネット上に流出した大規模言語モデルは自社製のものだとAI企業・MistralのCEOが確認

【ニュース】 ◆ネット上に流出した大規模言語モデルは自社製のものだとAI企業・MistralのCEOが確認 (Gigazine, 2024/02/01 13:22) https://gigazine.net/news/20240201-hugging-face-miqu-mistral-model/

大規模言語モデル(LLM)に精度・知識の更新速度・回答の透明性などを与える「RAG(検索拡張生成)」

【ニュース】 ◆大規模言語モデル(LLM)に精度・知識の更新速度・回答の透明性などを与える「RAG(検索拡張生成)」 (Gigazine, 2023/12/26 19:00) https://gigazine.net/news/20231226-retrieval-augmented-generation-llm/

Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指している

【ニュース】 ◆Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指している (Gigazine, 2023/12/22 11:55) https://gigazine.net/news/20231222-apple-iphone-llm-in-a-flash/ 【関連まとめ記事】◆全体まとめ ◆AI企業 (まとめ) ◆Apple (ま…

大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース

【ニュース】 ◆大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース (Gigazine, 2023/11/07 16:00) https://gigazine.net/news/20231107-vectara-measuring-hallucination/ 【関連まとめ記事】…

ChatGPT (まとめ)

malware-log.hatenablog.com 【辞書】 ◆ChatGPT (Wikipedia) https://ja.wikipedia.org/wiki/ChatGPT 【概要】■クローリングのブロック方法 User-agent: GPTBot Disallow: / 【ニュース】■2022年◇2022年12月 ◆ChatGPTとは何か そのできること/できないこと …

なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由”

【ニュース】 ◆なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由” (ITmedia, 2023/09/11 12:00) https://www.itmedia.co.jp/news/articles/2309/11/news083.html 【関連まとめ記事】◆全体まとめ ◆AIプロセッサ (ま…

大規模言語モデル(LLM)におけるGroundingについて

【公開情報】 ◆大規模言語モデル(LLM)におけるGroundingについて (Hakky, 2023/09/04) https://book.st-hakky.com/docs/llm-grounding/

“数学特化”の大規模言語モデル「WizardMath」 米Microsoftなどが開発 Llamaモデルを強化

【ニュース】 ◆“数学特化”の大規模言語モデル「WizardMath」 米Microsoftなどが開発 Llamaモデルを強化 (ITmedia, 2023/08/25 08:00) https://www.itmedia.co.jp/news/articles/2308/25/news059.html

Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される

【概要】 項目 内容 旧URL https://the-eye.eu/public/AI/pile_preliminary_components/books3.tar.gz (アクセス不可) 【ニュース】 ◆Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される (Gigazine,…

なぜAIは間違った回答をするのか――知っておきたい生成AIの基本

【ニュース】 ◆なぜAIは間違った回答をするのか――知っておきたい生成AIの基本 (日経BP, 2023/08/18) https://project.nikkeibp.co.jp/pc/atcl/19/06/21/00003/081600474/ 【関連まとめ記事】◆全体まとめ ◆AIの問題点 (まとめ) ◆ハルシネーション / Hallucina…

LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK

【概要】 項目 内容 名称 japanese-large-lm 特徴 オープンソース(OSS) 商用利用 可 パラメーター数 36億17億 コーパス LINE独自の大規模日本語Webコーパス (約650GBのコーパス) 【ニュース】 ◆LINE、日本語の大規模言語モデル公開 オープンソースで 商用…

Appleが独自の大規模言語モデルとチャットボットAI「Apple GPT」を開発中か

【ニュース】 ◆Appleが独自の大規模言語モデルとチャットボットAI「Apple GPT」を開発中か (Gigazine, 2023/07/20 10:49) https://gigazine.net/news/20230720-apple-gpt-on-ajax-apple-ai-framework/ 【関連まとめ記事】◆全体まとめ ◆AI企業 (まとめ) ◆Appl…

Llama 2 (まとめ)

【サービス】 ◆LLaMA2 Chatbot https://llama2.ai/ 【ニュース】 ◆Metaの大規模言語モデル「Llama 2」を無料で誰でもブラウザからお試しできる「LLaMA2 Chatbot」 (Gigazine, 2023/07/19 16:00) https://gigazine.net/news/20230719-llama-2-chatbot/ ⇒ http…

無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携

【ニュース】 ◆無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携 (ITmedia, 2023/07/19 03:51) https://www.itmedia.co.jp/news/articles/2307/19/news082.html

Bard (まとめ)

【辞書】 ◆Bard (Wikipedia) https://ja.wikipedia.org/wiki/Bard 【ニュース】■2023年◇2023年4月 ◆Googleの対話型AI「Bard」を「病的なウソつきで役に立たない」とGoogle社員自身がリリース前に評価していたことが暴露される (Gigazine, 2023/04/20 16:00) …

NEC、大規模言語モデルを開発。130億パラメーターの“軽量さ”と高い日本語能力をうたう

【図表】 出典: https://internet.watch.impress.co.jp/docs/news/1514361.html 【ニュース】 ◆NEC、大規模言語モデルを開発。130億パラメーターの“軽量さ”と高い日本語能力をうたう (Internet Watch, 2023/07/06 15:00) GPU1枚搭載のサーバーで動作でき、シ…

大規模言語モデル(LLM)を開発

【公開情報】 ◆大規模言語モデル(LLM)を開発 (NEC, 2023/07/06) https://jpn.nec.com/rd/technologies/202308/index.html

ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか?をAI企業のエンジニアが多数の図解でゼロから解説

【図表】 出典: https://gigazine.net/news/20230623-rlhf-llm/ 【ニュース】 ◆ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか?をAI企業のエンジニアが多数の図解でゼロから解説 (Gigazine, 2023//06/23) https://gigazine.net/news…

ChatGPTなどの対話型AIの基礎となっている「Attention」を可視化した「Attention Viz」

【ニュース】 ◆ChatGPTなどの対話型AIの基礎となっている「Attention」を可視化した「Attention Viz」 (Giagzine, 2023/05/20 19:00) https://gigazine.net/news/20230520-attention-viz/

Wrtn (まとめ)

【ニュース】 ◆対話型生成AIサービスを完全無料・無制限でローンチ GPT-4搭載、日本語に特化した「wrtn(リートン)」 (Mapion ニュース, 2023/05/19 17:30) https://www.mapion.co.jp/news/release/ap356165-all/ ⇒ https://tt-ai.hatenablog.com/entry/2023/…

対話型生成AIサービスを完全無料・無制限でローンチ GPT-4搭載、日本語に特化した「wrtn(リートン)」

【ニュース】 ◆対話型生成AIサービスを完全無料・無制限でローンチ GPT-4搭載、日本語に特化した「wrtn(リートン)」 (Mapion ニュース, 2023/05/19 17:30) https://www.mapion.co.jp/news/release/ap356165-all/ 【関連まとめ記事】◆全体まとめ ◆生成AI / ジ…

サイバーエージェント、「最大68億パラメーターの日本語大規模言語モデル」を一般公開

【ニュース】 ◆サイバーエージェント、「最大68億パラメーターの日本語大規模言語モデル」を一般公開 (Internet Watch, 2023/05/17 17:30) https://internet.watch.impress.co.jp/docs/news/1501323.html


Copyright (C) 谷川哲司 (Tetsuji Tanigawa) 1997 - 2023