シンガポールから日本に本社移転。「AI×人」のオペレーション設計で字幕翻訳業界を再編

東大IPCでは、「協創1号ファンド」「AOI1号ファンド」を通じ、国内外80社を超える大学関連のスタートアップに投資を行っている。その投資先であるスタートアップの経営者が描くビジョンや展開するビジネスの魅力、可能性について、投資担当者と一緒に語ってもらうシリーズの第4回目は、株式会社NUVO(ヌーヴォ)。東南アジア発でAI動画字幕編集ソフトウェアを開発する同社は、2023年に日本に本社を移転後、字幕・翻訳・通訳に強みを持つ3社を事業承継により統合し、現場知とAI技術を融合した強固なオペレーション体制を構築している。東大IPCから2022年11月を皮切りに3回の資金調達を行ったCEOの鈴木信彦氏と、投資担当者の古川圭祐氏に聞いた。
AIと人によるオペレーション設計で、コンテンツの多言語翻訳を効率化
―鈴木さんは、NUVOの前身となるベンチャーをシンガポールで創業、経営してこられたそうですが、まず経歴やご経験を教えてください。
鈴木:東大卒業後、三和銀行(現、三菱UFJ銀行)に入行して大企業営業や企画、海外業務を中心に17年間勤務しました。その間、2011年に米国DUKE大学でMBAを取得しました。銀行を退職後は日本郵政キャピタルにてベンチャー投資およびスタートアップとの協業推進に従事。その後2020年4月にシンガポールにてAI Communisを創業しました。2021年11月に音声認識・翻訳AI「Auris AI」をローンチ以降、自動生成された多言語字幕や翻訳文を人間の専門家がレビュー・修正するHuman-in-Loop型のオペレーションを構築してきました。そして、2023年7月に日本に本社移転する形で株式会社NUVOを設立し、引き続きCEOを務めています。
―この事業で創業された背景と、当初はシンガポールで設立し、後に日本に移転された理由を教えてください。
鈴木:銀行員時代にシンガポールに駐在し、4ヵ国語の多言語社会で行内の資料作成や翻訳を行う中で、その手間やコストの大きさを実感していました。そうして帰国後に勤めたVCで第二次AIブームの到来を迎え、あの人手中心のアナログな仕組みから脱却できると思ったのです。動画や音声コンテンツが急増し、グローバル化が進む中で、多言語化の現場は非効率かつ属人的であり、そこにAIとオペレーション設計で産業再編の余地があると考えました。リサーチして手応えを感じ、いち早く翻訳の学習データを蓄積したいと考えていたときに、シンガポール政府による翻訳字幕作成プロジェクトに採択され、またシンガポールでも有数のアクセラレータープログラムに採択され、シンガポールで起業したのです。
日本に本社移転を決めたのは、スタートアップとしてより成長していくために、1人当たりGDPが東南アジアの3~4倍の日本で、ビジネスに注力すべきだと考えたからです。そこで日本で営業を行ってみたところ、手応えが得られたので決めました。

―東大IPCでは、どのような支援を行ってこられたのですか。
古川:東大IPCはそもそも、日本人起業家が海外で活躍するのを応援したい気持ちが強く、鈴木さんには音声合成で名高い東大の猿渡・齋藤研究室を紹介したのを機に、2022年に初めて出資をさせてもらいました。その後、NUVOが資金的に苦しかったときにも、密にコミュニケーションしており、鈴木さんが事業を無事遂行させる力があることを確信していたため追加投資を行っています。それにより経営を好転させることができ、東大IPCとしても改めて学びのあった事例といえます。
そうして継続的に、多方面で可能な限りの支援を行っています。日本への本社移転についても早くから相談をいただき、マクロ視点からアドバイスさせていただきました。
M&Aで特徴ある翻訳会社をグループ化し、着実にスケールを実現
―改めて、昨今の翻訳業界の課題とNUVOの事業内容について教えてください。
鈴木:生成AIによってコンテンツの生成量は飛躍的に増えましたが、それを多言語に変換・配信するプロセスは依然としてアナログで属人性が高く、納期・品質・コストの点でも不安定です。特にメディアや金融、法律といった専門性の高い分野では、汎用的な翻訳ツールでは対応しきれません。
そのため、AIモデルを業界別の文脈に適合させ、人によるレビューを再現可能な業務プロセスに組みなおすことが重要です。そして、翻訳・字幕制作を案件ベースではなく、オペレーションベースに再設計することで、納期・品質・コストを安定させることができるのです。
当社では実際、音声認識・翻訳AIで自動生成された多言語字幕や翻訳文を専門家がレビュー・修正するオペレーション体制を構築しています。さらに業界特化型のAIエージェントを開発して、業界仕様に準拠した高精度かつ高速な多言語化を可能にしました。

―日本に本社移転後、翻訳会社を中心に3社を統合されたのはなぜですか。
鈴木:翻訳業界では、エンドクライアントとなる大企業はまず翻訳会社に依頼し、その先に当社のようなソフトウェアプロバイダー、そしてフリーランスの翻訳家がいるという構造があります。ですから当初は、当社が直接エンドクライアントに実績を持って営業しても翻訳会社を紹介されることが多く、そこで翻訳字幕や文字起こしの案件を受注してきました。そうした中で、当社の「AI×人」のモデルはコスト面だけでなく、品質面、納期の面でも、競争力が高いと分かりました。であれば、当社が「翻訳会社との関係は維持しつつ、機会があれば 、エンドクライアントに対するサービスプロバイダーのポジションに立てばよいと考えたのが最初です。実際に、多様な翻訳会社とお付き合いをするなかで、後継者がいないケースがあり、事業承継による統合を行うようになりました。
これまでに統合した3社はそれぞれ、当該地域の自治体に強かったり、金融系、メディア系に強いなどの特徴があります。今後もこのような統合は積極的に進めていく方針です。
AIとの共存で高精度・大量の翻訳を可能にし、収益化に成功
―統合後は、各社とどのように事業を進められているのですか。
鈴木:既存の雇用や翻訳担当者の体制は変更しないことをお約束しています。それぞれの専門家としての価値を大事にしてビジネスをされてきた方々なので、それを尊重することが大前提なのです。一方、日々のオペレーションは効率化の余地が多いので、当社が貢献できる部分です。
単にツールを導入するというのではなく、クライアントの業務フローを深く理解したうえで、エンドツーエンドで伴走できるのが当社の強みです。たとえば字幕翻訳の場合、動画を撮影・編集、録音したものをまず音声認識にかけ、タイムスタンプを付与した文字を、機械翻訳で翻訳字幕として自動生成します。それを専門家がチェックして最終版を仕上げ、その動画がWebサイトで公開されたり、SNSで運用されるという流れです。このフローに対して、必要な部分を適切に提案できるので、どのような運用をされているクライアントにも柔軟に対応ができるのです。
翻訳会社にとっては回転率が上がるので、売上向上につながっています。また翻訳者に対しても、報酬単価を下げずにより多くの仕事を依頼できるので、収入増につながっているケースが多く、大変喜ばれています。
―翻訳はAIによって「無くなる仕事」と言われがちですが、NUVOのやり方であればAIと共存し、かつ品質を向上できるのですね。
鈴木:そのとおりです。たとえば上場企業からの依頼は、8万字規模の資料の翻訳などであり、当社のAIであればこうした大量の文字数も一括で処理できますが、一般的なAI翻訳の無料プランでは3000~5000字までといった字数制限があり、非効率です。そこをテクノロジーや品質の面で守っていくのが当社のオペレーションのあり方。ですから、十分に需要があり続ける市場で当社ならびにグループを成長させていけると考えています。
―東大IPCでは、NUVOのこうした事業展開をどう見ていますか。
古川:少子化や後継者問題をふまえ、次代を模索する企業がますます増えています。その流れでサーチファンド(経営者を目指す個人が、投資家の支援を受けながら経営したい会社を探し、買収する仕組み)が出てきたり、M&Aが盛んになっているわけですが、翻訳業界でも同様のニーズがあるのは間違いありません。ただ、こうした事業の引き受け手をスタートアップが担うのはチャレンジングです。M&Aの難しさはPMIにあり、それは難しさをわかっていないと失敗しかねません。その点、鈴木さんは銀行出身で様々なケースをご覧になっており、かつ投資側の経験もある方なので安心しています。
鈴木:統合にあたってのデューデリなどはもちろん当社でやりますが、古川さんには事前に相談しています。投資家目線や最近の上場トレンドなどをふまえて、当社にはないマクロな目線で方向性をアドバイスいただけ、助かっています。
この数年で、メディア・金融・法律分野の「言語インフラ基盤」を目指す
―現在、顧客や売上の状況はどのようになっていますか。
鈴木:売上は日本が8割5分で、官公庁のほか、地方自治体が30以上。他にもエンタープライズを中心に、メディアでは欧米系主要メディアに加えて、日系のキー局などが顧客となっています。紹介もいただけるので横展開を進め、近々に日本での売上は全体の9割を占めると見込んでいます。この2年くらいは日本でしっかり顧客開拓を行っていきます。その先はヨーロッパでの展開を考えたいですね。これが既存の経営資源を生かした戦略で、さらにノンオーガニックに広げていきます。
古川:すでにグループに迎えた3社を見ても、それぞれに古くからの顧客基盤を有しています。こうした翻訳会社は自治体や民間を問わず、まだまだ日本中に多くあると思うので、M&Aによる統合は積極的に進めてほしいですね。
NUVOは、このようにスタートアップが買い手となるM&Aの先駆的存在です。近年、イグジット戦略としてスタートアップ同士のM&Aが注目されてきていますが、NUVOが体現しているノンオーガニックなグロースの仕方が広がっていけば、エコシステム全体にとっても大いにプラスだと思い、期待しています。
―NUVOが目指す世界観を教えてください。
鈴木:この2~3年は日本市場を中心に、LSI(Language Solutions Integrator:言語ソリューション統合事業者)として、業界別オペレーションを深耕していきますが、その先には、APIや業界特化型AIエージェントを外部に提供し、アジア地域におけるLTP(Language Technology Platform:言語テクノロジープラットフォーム)としての展開を推進したいと考えています。そうして、特にメディアや金融、法律分野における「言語インフラの基盤」となるのが目指す姿です。
「再現性」「スピード」「品質向上」「スケーラビリティ」の価値提供が強み
―NUVOのチームについて、ご紹介ください。
鈴木:多国籍なチームで、エンジニアやプロジェクトコーディネーター、オペレーションマネージャーなど、多様な専門人材が所属しています。
職場環境はフルリモートなので場所や時間にとらわれずに働くことができ、各人が一定の責任を持って業務を遂行しているチームです。イタリアと米国オレゴンにプロジェクトマネージャーを置いており、時差があるので日本が夜間・休業中でもヨーロッパやアメリカの拠点が稼働する体制を構築しています。これにより、世界中のクライアントからの要望に各地のタレントが応えることができています。今後は日本のプロジェクトマネージャーも補強して、私自身はM&A案件の精査や事業提携、営業活動により注力していきたいと考えています。

―スタートアップで働くことに興味のある方々に、一言お願いします。
鈴木:日本でも伝統的な業務をソフトウェアに置き換える動きが広がっていますが、大事なのはオペレーションできているか否かです。業務についての理解が浅かったり、机上の空論だったりでは現場は動きません。ですから当社では、現場が好きで、具体的にコンテンツをお客様にデリバリーすることに喜びを感じる人を、業界経験の有無にかかわらず、お迎えしたいと考えています。そうしたマインドセットや人となりが大事ですね。
―最後に、事業会社の方々へメッセージをお願いします。
鈴木:当社のバリュープロポジションは、「再現性」「スピード」「品質向上」「スケーラビリティ」の4点にあります。これらをLSIとして、AIと専門家の知見を掛け合わせることで担保しています。
再現性については、業界特有の業務知識やチェックポイントをAIエージェントに実装して、誰がやっても同じ品質を実現。スピードについては、案件の立ち上げから納品までを、たとえば字幕案件であれば5日かかったものを1日に短縮できます。品質については、AIに用語やスタイル違反を事前検知させ、人間は文脈と表現に集中することで、ミスを構造的に減少させます。スケーラビリティについては、多言語・多案件を同時に扱いながらも、属人的なPM体制から脱却し、運用コストを抑えながら拡大を可能にしています。
自社サイトやマニュアル、会社紹介動画などの翻訳・字幕翻訳に関して、再現性やスピード、品質、スケーラビリティの点でお困りの方がいれば、ぜひ当社にお声がけください。
