TT AI Log

人工知能 / AI / 脳機能解析 に関する「個人」の調査・研究・参照ログ

学習データセット

AIモデルのトレーニングデータを開示することを義務付ける法案が提出される

【ニュース】 ◆AIモデルのトレーニングデータを開示することを義務付ける法案が提出される (Gigazine, 2023/12/24 13:00) https://gigazine.net/news/20231224-ai-required-disclose-training-data-bill/

MetaのAIのトレーニングに使われた書籍データセット「Books3」には村上春樹やスティーブン・キングの著作も含まれている

【ニュース】 ◆MetaのAIのトレーニングに使われた書籍データセット「Books3」には村上春樹やスティーブン・キングの著作も含まれている (Gigazine, 2023/09/29 21:00) https://gigazine.net/news/20230929-books3-ai-training-meta-copyright-infringement/

学習データセット (まとめ)

【ニュース】■2018年 ◆セキュリティ研究者に朗報、マルウェア検出AIの訓練データセット (ASCII.jp, 2018/05/23 11:54) http://ascii.jp/elem/000/001/680/1680952/ ⇒ https://tt-ai.hatenablog.com/entry/2018/05/23/000000 ■2023年 ◆ChatGPTはクラウドワー…

Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される

【概要】 項目 内容 旧URL https://the-eye.eu/public/AI/pile_preliminary_components/books3.tar.gz (アクセス不可) 【ニュース】 ◆Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される (Gigazine,…

Meta、画像内アイテム識別のAIモデル「SAM」と大規模データセットを無償公開

【ニュース】 ◆Meta、画像内アイテム識別のAIモデル「SAM」と大規模データセットを無償公開 (ITmedia, 2023/04/06 08:19) https://www.itmedia.co.jp/news/articles/2304/06/news077.html 【関連情報】 ◆segment-anything (facebookresearch, 2023/04/06) ht…

ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?

【ニュース】 ◆ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は? (ITmedia, 2023/04/05 08:00) https://www.itmedia.co.jp/news/articles/2304/05/news051.html 【関連まとめ記事】◆全体まとめ ◆生成AI / ジェネレーティブAI (ま…

セキュリティ研究者に朗報、マルウェア検出AIの訓練データセット

【ニュース】 ◆セキュリティ研究者に朗報、マルウェア検出AIの訓練データセット (ASCII.jp, 2018/05/23 11:54) http://ascii.jp/elem/000/001/680/1680952/ 【関連まとめ記事】◆全体まとめ ◆データ (まとめ) ◆学習データセット (まとめ) https://tt-ai.haten…


Copyright (C) 谷川哲司 (Tetsuji Tanigawa) 1997 - 2023