GPT-4 (まとめ)

AI: GPT-4 (OpenAI) **まとめ大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆OpenAIのGPT-4はCVEのセキュリティ勧告を読むことで実際の脆弱性を悪用できることが明らかに (Gigazine, 2024/04/22 14:08) https://gigazine.net/news/20240422-gpt-4-craft-attacks-based-chip-vulnerabilities/ ⇒ https://tt-ai.hatenablog…

#GPT-4 #生成AI #LLM #大規模言語モデル

2024-04-08

Command R＋ (まとめ)

AI: Command R＋ **まとめ *生成AI / ジェネレーティブAI 大規模言語モデル / LLM / Large-Scale Language Model

【要点】 ◎Cohere が開発したオープンソースの大規模言語モデル（LLM）。2024/04/04に公開【サイト】 ◆Command R+ (Cohere) https://docs.cohere.com/docs/command-r-plus ◆Hugging Faceから利用 (HuggingFace) https://huggingface.co/spaces/CohereForAI/…

#Command R＋ #生成AI #LLM #大規模言語モデル

2024-03-28

Databricksがオープンな大規模言語モデル「DBRX」をリリース、GPT-3.5やCodeLLaMA-70Bを上回る性能

AI: DBRX 大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆Databricksがオープンな大規模言語モデル「DBRX」をリリース、GPT-3.5やCodeLLaMA-70Bを上回る性能 (Gigazine, 2024/03/28 11:45) https://gigazine.net/news/20240328-dbrx-open-llm-databricks/

2024-03-21

OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道

AI: GPT-5 企業: OpenAI 大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道 (Gigazine, 2024/03/21 10:46) https://gigazine.net/news/20240321-gpt-5-rumor/ 【関連まとめ記事】◆全体まとめ ◆AI企業 (まとめ) ◆OpenAI (まとめ) ◆GPT-5 (まとめ)…

2024-03-19

EagleX (まとめ)

AI: EagleX 大規模言語モデル / LLM / Large-Scale Language Model **まとめ

【ニュース】 ◆英語やその他言語の処理でLlama-2を超えたAIモデル「EagleX」がオープンソースで登場 (Gigazine, 2024/03/19 23:00) https://gigazine.net/news/20240319-eaglex-1-7t/ ⇒ https://tt-ai.hatenablog.com/entry/2024/03/19/000000 【関連まとめ…

2024-03-19

英語やその他言語の処理でLlama-2を超えたAIモデル「EagleX」がオープンソースで登場

AI: EagleX 大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆英語やその他言語の処理でLlama-2を超えたAIモデル「EagleX」がオープンソースで登場 (Gigazine, 2024/03/19 23:00) https://gigazine.net/news/20240319-eaglex-1-7t/ 【関連まとめ記事】◆全体まとめ ◆生成AI / ジェネレーティブAI (まとめ) …

2024-02-24

なぜ大規模言語モデル(LLM)はだまされやすいのか？

大規模言語モデル / LLM / Large-Scale Language Model プロンプト・インジェクション / プロンプト注射

【ニュース】 ◆なぜ大規模言語モデル(LLM)はだまされやすいのか？ (Gigazine, 2024/02/24 10:00) https://gigazine.net/news/20240224-llm-gullible/

2024-02-21

LLMがWebサイトを自動ハッキング　研究者らが各LLMの性能を比較

大規模言語モデル / LLM / Large-Scale Language Model AI技術の悪用

【ニュース】 ◆LLMがWebサイトを自動ハッキング研究者らが各LLMの性能を比較 (ITmedia, 2024/02/21 11:30) 最新の研究でLLMがWebサイトを自動的にハッキングできることが明らかになった。自律的なWebサイトハッキングの可能性が実証され、防御と攻撃のバラ…

2024-02-01

ネット上に流出した大規模言語モデルは自社製のものだとAI企業・MistralのCEOが確認

大規模言語モデル / LLM / Large-Scale Language Model AI: miqu-1-70b

【ニュース】 ◆ネット上に流出した大規模言語モデルは自社製のものだとAI企業・MistralのCEOが確認 (Gigazine, 2024/02/01 13:22) https://gigazine.net/news/20240201-hugging-face-miqu-mistral-model/

2023-12-26

大規模言語モデル(LLM)に精度・知識の更新速度・回答の透明性などを与える「RAG(検索拡張生成)」

大規模言語モデル / LLM / Large-Scale Language Model 検索拡張生成 / RAG

【ニュース】 ◆大規模言語モデル(LLM)に精度・知識の更新速度・回答の透明性などを与える「RAG(検索拡張生成)」 (Gigazine, 2023/12/26 19:00) https://gigazine.net/news/20231226-retrieval-augmented-generation-llm/

2023-12-22

Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指している

大規模言語モデル / LLM / Large-Scale Language Model 企業: Apple

【ニュース】 ◆Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指している (Gigazine, 2023/12/22 11:55) https://gigazine.net/news/20231222-apple-iphone-llm-in-a-flash/ 【関連まとめ記事】◆全体まとめ ◆AI企業 (まとめ) ◆Apple (ま…

2023-11-07

大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース

ハルシネーション / Hallucination / 幻覚大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース (Gigazine, 2023/11/07 16:00) https://gigazine.net/news/20231107-vectara-measuring-hallucination/ 【関連まとめ記事】…

2023-09-28

ChatGPT (まとめ)

AI: ChatGPT (OpenAI) **まとめ大規模言語モデル / LLM / Large-Scale Language Model

malware-log.hatenablog.com 【辞書】 ◆ChatGPT (Wikipedia) https://ja.wikipedia.org/wiki/ChatGPT 【概要】■クローリングのブロック方法 User-agent: GPTBot Disallow: / 【ニュース】■2022年◇2022年12月 ◆ChatGPTとは何かそのできること／できないこと …

#ChatGPT #AI #人工知能 #大規模言語モデル

2023-09-11

なぜ日本はGPUのない「富岳」でLLMを研究するのか　外国に後れを取らないための“現実的な理由”

デバイス: GPGPU 大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆なぜ日本はGPUのない「富岳」でLLMを研究するのか外国に後れを取らないための“現実的な理由” (ITmedia, 2023/09/11 12:00) https://www.itmedia.co.jp/news/articles/2309/11/news083.html 【関連まとめ記事】◆全体まとめ ◆AIプロセッサ (ま…

2023-09-04

大規模言語モデル（LLM）におけるGroundingについて

グラウンディング / Grounding 大規模言語モデル / LLM / Large-Scale Language Model

【公開情報】 ◆大規模言語モデル（LLM）におけるGroundingについて (Hakky, 2023/09/04) https://book.st-hakky.com/docs/llm-grounding/

2023-08-25

“数学特化”の大規模言語モデル「WizardMath」　米Microsoftなどが開発　Llamaモデルを強化

大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆“数学特化”の大規模言語モデル「WizardMath」米Microsoftなどが開発 Llamaモデルを強化 (ITmedia, 2023/08/25 08:00) https://www.itmedia.co.jp/news/articles/2308/25/news059.html

2023-08-21

Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される

大規模言語モデル / LLM / Large-Scale Language Model 学習データセット法律: 著作権法著作権

【概要】項目内容旧URL https://the-eye.eu/public/AI/pile_preliminary_components/books3.tar.gz (アクセス不可) 【ニュース】 ◆Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される (Gigazine,…

2023-08-18

なぜAIは間違った回答をするのか――知っておきたい生成AIの基本

ハルシネーション / Hallucination / 幻覚大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆なぜAIは間違った回答をするのか――知っておきたい生成AIの基本 (日経BP, 2023/08/18) https://project.nikkeibp.co.jp/pc/atcl/19/06/21/00003/081600474/ 【関連まとめ記事】◆全体まとめ ◆AIの問題点 (まとめ) ◆ハルシネーション / Hallucina…

2023-08-14

LINE、日本語の大規模言語モデル公開　オープンソースで　商用利用もOK

大規模言語モデル / LLM / Large-Scale Language Model

【概要】項目内容名称 japanese-large-lm 特徴オープンソース（OSS）商用利用可パラメーター数 36億17億コーパス LINE独自の大規模日本語Webコーパス (約650GBのコーパス) 【ニュース】 ◆LINE、日本語の大規模言語モデル公開オープンソースで商用…

2023-07-20

Appleが独自の大規模言語モデルとチャットボットAI「Apple GPT」を開発中か

AI: Apple GPT 企業: Apple 大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆Appleが独自の大規模言語モデルとチャットボットAI「Apple GPT」を開発中か (Gigazine, 2023/07/20 10:49) https://gigazine.net/news/20230720-apple-gpt-on-ajax-apple-ai-framework/ 【関連まとめ記事】◆全体まとめ ◆AI企業 (まとめ) ◆Appl…

2023-07-19

Llama 2 (まとめ)

AI: Llama 2 **まとめ大規模言語モデル / LLM / Large-Scale Language Model *生成AI / ジェネレーティブAI

【サービス】 ◆LLaMA2 Chatbot https://llama2.ai/ 【ニュース】 ◆Metaの大規模言語モデル「Llama 2」を無料で誰でもブラウザからお試しできる「LLaMA2 Chatbot」 (Gigazine, 2023/07/19 16:00) https://gigazine.net/news/20230719-llama-2-chatbot/ ⇒ http…

#Llama 2 #生成AI

2023-07-19

無料で商用可、ChatGPT（3.5）に匹敵する生成AI「Llama 2」　Metaが発表、Microsoftと優先連携

AI: Llama 2 *生成AI / ジェネレーティブAI 大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆無料で商用可、ChatGPT（3.5）に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携 (ITmedia, 2023/07/19 03:51) https://www.itmedia.co.jp/news/articles/2307/19/news082.html

2023-07-14

Bard (まとめ)

AI: Gemini / Bard (Google) **まとめ大規模言語モデル / LLM / Large-Scale Language Model

【辞書】 ◆Bard (Wikipedia) https://ja.wikipedia.org/wiki/Bard 【ニュース】■2023年◇2023年4月 ◆Googleの対話型AI「Bard」を「病的なウソつきで役に立たない」とGoogle社員自身がリリース前に評価していたことが暴露される (Gigazine, 2023/04/20 16:00) …

#Bard #AI #人工知能 #大規模言語モデル

2023-07-06

NEC、大規模言語モデルを開発。130億パラメーターの“軽量さ”と高い日本語能力をうたう

大規模言語モデル / LLM / Large-Scale Language Model 企業: NEC

【図表】出典: https://internet.watch.impress.co.jp/docs/news/1514361.html 【ニュース】 ◆NEC、大規模言語モデルを開発。130億パラメーターの“軽量さ”と高い日本語能力をうたう (Internet Watch, 2023/07/06 15:00) GPU1枚搭載のサーバーで動作でき、シ…

2023-07-06

大規模言語モデル（LLM）を開発

大規模言語モデル / LLM / Large-Scale Language Model *生成AI / ジェネレーティブAI 企業: NEC

【公開情報】 ◆大規模言語モデル（LLM）を開発 (NEC, 2023/07/06) https://jpn.nec.com/rd/technologies/202308/index.html

2023-06-23

ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか？をAI企業のエンジニアが多数の図解でゼロから解説

*生成AI / ジェネレーティブAI 大規模言語モデル / LLM / Large-Scale Language Model **必読レポート

【図表】出典: https://gigazine.net/news/20230623-rlhf-llm/ 【ニュース】 ◆ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか？をAI企業のエンジニアが多数の図解でゼロから解説 (Gigazine, 2023//06/23) https://gigazine.net/news…

2023-05-20

ChatGPTなどの対話型AIの基礎となっている「Attention」を可視化した「Attention Viz」

ツール: Attention Viz 大規模言語モデル / LLM / Large-Scale Language Model Attention

【ニュース】 ◆ChatGPTなどの対話型AIの基礎となっている「Attention」を可視化した「Attention Viz」 (Giagzine, 2023/05/20 19:00) https://gigazine.net/news/20230520-attention-viz/

2023-05-19

Wrtn (まとめ)

AI: Wrtn **まとめ *生成AI / ジェネレーティブAI 大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆対話型生成AIサービスを完全無料・無制限でローンチ GPT-4搭載、日本語に特化した「wrtn(リートン)」 (Mapion ニュース, 2023/05/19 17:30) https://www.mapion.co.jp/news/release/ap356165-all/ ⇒ https://tt-ai.hatenablog.com/entry/2023/…

#Wrtn #AI

2023-05-19

対話型生成AIサービスを完全無料・無制限でローンチ　GPT-4搭載、日本語に特化した「wrtn(リートン)」

AI: Wrtn *生成AI / ジェネレーティブAI 大規模言語モデル / LLM / Large-Scale Language Model

【ニュース】 ◆対話型生成AIサービスを完全無料・無制限でローンチ GPT-4搭載、日本語に特化した「wrtn(リートン)」 (Mapion ニュース, 2023/05/19 17:30) https://www.mapion.co.jp/news/release/ap356165-all/ 【関連まとめ記事】◆全体まとめ ◆生成AI / ジ…

2023-05-17

サイバーエージェント、「最大68億パラメーターの日本語大規模言語モデル」を一般公開

大規模言語モデル / LLM / Large-Scale Language Model AI: OpenCALM (サイバーエージェント)

【ニュース】 ◆サイバーエージェント、「最大68億パラメーターの日本語大規模言語モデル」を一般公開 (Internet Watch, 2023/05/17 17:30) https://internet.watch.impress.co.jp/docs/news/1501323.html

TT AI Log

人工知能 / AI / 脳機能解析に関する「個人」の調査・研究・参照ログ

大規模言語モデル / LLM / Large-Scale Language Model

GPT-4 (まとめ)

Command R＋ (まとめ)

Databricksがオープンな大規模言語モデル「DBRX」をリリース、GPT-3.5やCodeLLaMA-70Bを上回る性能

OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道

EagleX (まとめ)

英語やその他言語の処理でLlama-2を超えたAIモデル「EagleX」がオープンソースで登場

なぜ大規模言語モデル(LLM)はだまされやすいのか？

LLMがWebサイトを自動ハッキング　研究者らが各LLMの性能を比較

ネット上に流出した大規模言語モデルは自社製のものだとAI企業・MistralのCEOが確認

大規模言語モデル(LLM)に精度・知識の更新速度・回答の透明性などを与える「RAG(検索拡張生成)」

Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指している

大規模言語モデルが「幻覚」を引き起こすリスクを客観的に検証できるオープンソースの評価モデルをVectaraがリリース

ChatGPT (まとめ)

なぜ日本はGPUのない「富岳」でLLMを研究するのか　外国に後れを取らないための“現実的な理由”

大規模言語モデル（LLM）におけるGroundingについて

“数学特化”の大規模言語モデル「WizardMath」　米Microsoftなどが開発　Llamaモデルを強化

Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される

なぜAIは間違った回答をするのか――知っておきたい生成AIの基本

LINE、日本語の大規模言語モデル公開　オープンソースで　商用利用もOK

Appleが独自の大規模言語モデルとチャットボットAI「Apple GPT」を開発中か

Llama 2 (まとめ)

無料で商用可、ChatGPT（3.5）に匹敵する生成AI「Llama 2」　Metaが発表、Microsoftと優先連携

Bard (まとめ)

NEC、大規模言語モデルを開発。130億パラメーターの“軽量さ”と高い日本語能力をうたう

大規模言語モデル（LLM）を開発

ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか？をAI企業のエンジニアが多数の図解でゼロから解説

ChatGPTなどの対話型AIの基礎となっている「Attention」を可視化した「Attention Viz」

Wrtn (まとめ)

対話型生成AIサービスを完全無料・無制限でローンチ　GPT-4搭載、日本語に特化した「wrtn(リートン)」

サイバーエージェント、「最大68億パラメーターの日本語大規模言語モデル」を一般公開