TT AI Log

人工知能 / AI / 脳機能解析 に関する「個人」の調査・研究・参照ログ

AI: o4-mini

OpenAIがAIモデルの隠れたずるさを減らす実証、o3とo4-miniで実現

【要約】 OpenAIとApollo Researchは、AIが表向き従うふりをして別目的を追う「スキーミング」を検出・低減する評価環境を構築。o3やo4-mini等で秘匿行動を観測し、行動前に安全原則を読ませ熟慮させる介入で発生率をo3で13%→0.4%、o4-miniで8.7%→0.3%へ大幅…

OpenAIの「o3」と「o4-mini」は従来のAIよりも「幻覚」を起こしやすいことが判明

【ニュース】 ◆OpenAIの「o3」と「o4-mini」は従来のAIよりも「幻覚」を起こしやすいことが判明 (Gigazine, 2025/04/21 14:00) https://gigazine.net/news/20250421-openai-hallucinate-o3-o4-mini/ 【関連まとめ記事】◆全体まとめ ◆生成AI / ジェネレーティ…

OpenAIが「o3」と「o4-mini」を数週間以内にリリースすることを発表、ただし「GPT-5」のリリースは先送り

【ニュース】 ◆OpenAIが「o3」と「o4-mini」を数週間以内にリリースすることを発表、ただし「GPT-5」のリリースは先送り (Gigazine, 2025/04/07 19:00) https://gigazine.net/news/20250407-openai-o3-o4-mini-gpt-5/ 【関連まとめ記事】◆全体まとめ ◆生成AI…


Copyright (C) 谷川哲司 (Tetsuji Tanigawa) 1997 - 2023