ビジネスシーンでは、議事録作成や打ち合わせの記録など、「この会議の内容が文字にできると良いな」と思われる方は少なくないのでしょうか。 私たち記者もその1人です。1時間以上に及ぶインタビューや記者発表会などは少なくありません。もちろん ...
OpenAIが高精度の音声認識・ 文字起こしを実現できるモデルであるWhisperを公開してから数年、Whisperを元にしたさまざまなツールが登場しました。今回紹介するWhisperLiveKitもそのひとつで、ローカルマシンで使える上に、より低遅延で話者認識にも対応して ...
画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで ...
米OpenAIが2022年に発表した音声テキスト変換AI「Whisper」に、文章の一部または全部を捏造してしまういわゆる「幻覚」による重大な欠陥があると、米Associated Pressは10月26日(現地時間)、多数のエンジニアや研究者へのインタビューに基づいて報じた。
OpenAIは文字起こしAIのWhisperを「人間レベルの堅牢性と正確性を持ったツール」と宣伝していますが、これには大きな欠点があると専門家たちが指摘しています。十数人のソフトウェアエンジニア、開発者、学術研究者にインタビューしたというAP通信による ...