手話と音声を、AIでつなぐ ―― ソフトバンクのコミュニケーションアプリ「SureTalk(シュアトーク)」
公開日 更新日
- ヒアリング先
- ソフトバンク株式会社プロダクトR&D本部 技術企画開発第1統括部 事業企画管理部 SureTalk課 薄井 章代 氏
「どこでも、誰とでも、円滑に会話できる環境」を目指して。聞こえる人と聞こえない人との間にある情報格差に、ソフトバンクがAIで応えるのが「SureTalk(シュアトーク)」です。カメラに映した手話をテキストに、音声をテキストに変換し、チャットのように会話を成立させる ―― その仕組みと、多文化共生に向けた取り組みを伺いました。
SureTalkとは
SureTalkは、AIを使って手話ユーザーと音声ユーザーの間で会話をしたり、手話を登録してAIに学習させたりできるコミュニケーションツールです。手話ユーザーが端末のカメラに向かって手話をすると、その内容がテキストに変換されます。音声ユーザーがマイクに向かって話すと、こちらもテキストに変換されます。両者のやりとりは、チャットのような形式で画面に表示され、テキストを介して会話が成立します。
利用はパソコンやタブレットから、インターネットを介して行います。そのため、同じ場所で向き合う対面利用はもちろん、離れた場所どうしの遠隔利用にも対応します。日本語対応手話・中間型手話・日本手話といった日本の手話に対応し、必要に応じて国際手話・アメリカ手話のグローバル版も利用できます。
背景にあるのは、聞こえない・聞こえづらい人が直面する情報格差の問題です。「どこでも、誰とでも、円滑に会話できる環境」づくりの一助となることを、SureTalkは目指しています。
SureTalkとは
SureTalkが目指す未来
SureTalkは2021年から自治体(一部、企業や団体を含む)を中心に実証実験を進めており、現在は自治体・企業・大学・団体などで利用されています。今後は、より多様な場面での活用を目指して開発が進められています。さまざまなシーンで使えるようにするには、それぞれの場面に応じた手話データを着実に積み重ねていく必要があります。
SureTalkは、ソフトバンクが開発を進めるとともに「手話言語等の多文化共生社会協議会(通称:SiLa協議会)」というコンソーシアムの中でも活動しています。同協議会は全日本ろうあ連盟などを特別会員に迎え、複数の大学による研究開発、企業による実用化・普及促進、自治体や聴覚障害者協会による実証・動画収集協力といった役割分担で運営されています。聞こえない人が不自由さを意識することなく社会参画し、伸びやかに自己実現できる、共生的かつ共創的なコミュニケーションの基盤づくりが、その目指す方向です。
SureTalkに実装されている機能
SureTalkの中核は、手話を読み取る独自の認識技術と、それを支えるデータ登録の仕組みにあります。
- 骨格による手話認識:手話ユーザーが画面の前で手話をすると、指や腕の「骨格」で動作を追跡します。その骨格動作を、データベースに登録された手話データと照合し、AIが最も近い表現を自動的に紐づけてテキスト化します。映像そのものではなく骨格の動きを捉える点が、認識技術の特徴です。
- 双方向のテキスト変換:手話→テキスト、音声→テキストの両方向に対応し、チャット形式で会話が進みます。手話を知らない人でも、画面上の文字を通じて聞こえない方とやりとりができます。
- 手話の登録・学習機能:手話には個人ごとの動きや形のくせ、地域による方言、年代による違いがあり、同じ意味でも表現はさまざまです。そのため認識精度を高めるには、多くの動画データの登録が欠かせません。SureTalkは、利用したい単語や文章を、使いたい表現で自由に追加登録できる仕組みを備えています。
- 学習サイクルによる精度向上:自治体の実証実験では、1週間かけて利用したい手話データを登録し、週末に学習モデルを生成、翌週に認識を確認して必要に応じて追加登録する、というサイクルを回しています。利用環境に合わせて登録を重ねることで、学習モデルを最適化していきます(登録には撮影専用のツールを使用します)。
一方で、SureTalkはあくまで補助的なツールとして位置づけられています。複雑な内容や高い正確性が求められる場面では、従来どおり手話通訳者による対応(現地通訳・遠隔通訳)が想定されています。SureTalkが目指すのは、通訳者の負担軽減と、聞こえづらい方の生活利便性向上の両立です。
手話認識の仕組み
SureTalkの利用者の声
導入の現場では、実証的な利用とあわせて手話動画の撮影に協力いただくことで、サービスの品質向上が図られています。役所の相談窓口に設置した活用例では、手話通訳者が1名常駐していても、聞こえづらい来庁者が複数重なればお待たせしてしまいます。そうした場面でSureTalkを使えば、手話が分からない職員でも、簡単なやりとりであれば来庁者を待たせずに一次対応ができます。
実際の声として、自治体からは「手話を使われる方の窓口案内に活用できたら」という期待が寄せられ、「いつか手話通訳者がいなくてもお待たせしない窓口対応ができるよう活用したい」という前向きなコメントも聞かれます。市町村としての取り組みのアピールにつながるとして、積極的に活用している自治体もあるとのことです。
こうした一つひとつの利用と、それに伴う手話データの蓄積が、認識精度の向上と活用シーンの拡大につながっていきます。データを蓄積するほどにAIが学び、より多くの人の手話を読み取れるようになります。SureTalkは、その循環を回しながら日々精度を高めています。
利用イメージ(例:役所の相談窓口)
参考情報・リンク
コメント
-
本Webサイトの運営担当者です。2005年から、産学官連携や産業振興の業務に携わっています。
コメント
お話を伺い、個人によって手話の動き・形に特徴があること、地域による違いがあること、そして手話といっても「日本語対応手話」「中間型手話」「日本手話」「国際手話」「アメリカ手話」など様々な種類があることを知り、手話をAIで精度高く理解することの難易度の高さを実感しました。同時に、だからこそ本取り組みが持つ意義と価値について深く腹落ちしました。
技術面では、「骨格」の動作で手話を認識しているという仕組みに強い興味を持ちました。一人ひとり異なる手話の表現を、骨格動作として捉え、データベースと照合してテキスト化するという手法は、多様性をそのまま受けとめる柔軟さを備えていると感じます。
SureTalkは、自治体をはじめ様々な場面で利用され、AIが学習を重ねることで認識精度が高まっていく仕組みです。データを蓄積するほど賢くなり、 多くの方の手話を読み取れるようになることで、活用の場面もさらに広がっていきます。役所の窓口で「あるだけで安心できる」という声が寄せられているように、聞こえる人と聞こえない人が分け隔てなく対話できる環境は、これからの社会の基盤となるものです。
手話通訳者の負担軽減と、聞こえづらい方の生活利便性向上の両方を見据えた本ツールが、インクルーシブ社会の基幹ツールとして広く普及していくことを期待しています。このコメントと投稿者はデジタル証明書(VC)によって真正性が保証されています。
このコメントと投稿者情報は、「改竄されていないか」や「正当な投稿者か」などを暗号学的に検証できる〈Verifiable Credential(VC)〉によって保証されています。
それらがシステム上で検証された後に記事にコメントとして表示されています。VCとは
VC(Verifiable Credential)は、デジタル空間で「改ざんが検知可能」かつ「即座に検証可能」な証明書です。
紙の証明書やPDFと異なり、暗号技術により真正性が数学的に保証されており、W3Cにより制定された国際標準規格です。









須藤 慎
記事作成者
株式会社キャンパスクリエイト・専務取締役・プロデューサー