株式会社エーピーコミュニケーションズの永里氏は、リアルタイム文字起こし処理について、検証のアーキテクチャを紹介し、実際にデモを行いました。 永里氏の自己紹介 永里洋氏:今回はStudyCoさんのLT会に初参加ということで、よろしくお願いいたします。
OpenAIは文字起こしAIのWhisperを「人間レベルの堅牢性と正確性を持ったツール」と宣伝していますが、これには大きな欠点があると専門家たちが指摘しています。十数人のソフトウェアエンジニア、開発者、学術研究者にインタビューしたというAP通信による ...
英語コーチング「プログリット(PROGRIT)」を展開している株式会社プログリット(本社:東京都千代田区有楽町、代表取締役社長:岡田 祥吾)は、OpenAI社の音声認識モデル「Whisper」を活用したAI英語学習サポートサービス「プログリットスピーチチェッカー ...
ウェブブラウザ「Firefox」などを開発するMozillaが、OpenAIの「Whisper」ベースの文字起こしAI「Whisperfile」を開発中であることを発表しました。Whisperfileでは、英語以外の音声を英語に翻訳することも可能とのことです。 Mozillaが開発中のWhisperfileは、OpenAIの文字 ...
米AppStoreにて配信が始まった「ChatGPT for iOS」 ChatGPTはユーザーが自然言語を用いて、AIと対話できるのが大きな特徴。質問に対する答えをチャット形式で得られる他、文章やコンテンツの作成も可能だ。初めて一般公開されたのは2022年11月で、その言語モデル ...
株式会社東京アーカイブセンター(本社:東京都豊島区、代表取締役:吉田 隆、以下東京アーカイブセンター)は音声認識ソフトウェアにより音声をテキスト化する『AI文字起こし』サービスにおいて、Google Cloud、Ami Voice Cloud Platformに新たにOpenAI社が提供 ...
AutoMemoは、ソースネクストが2020年12月に最初のモデルを発売したAIボイスレコーダーです。 2022年1月にはコンパクトなポケットサイズの本体に、音声文字起こしの結果をリアルタイムに表示するタッチ液晶を載せた「AutoMemo S」がラインナップに加わりました。
ビジネスシーンでは、議事録作成や打ち合わせの記録など、「この会議の内容が文字にできると良いな」と思われる方は少なくないのでしょうか。 私たち記者もその1人です。1時間以上に及ぶインタビューや記者発表会などは少なくありません。もちろん ...