道なき道を拓き、未だ見ぬ新しい価値を世に送り出す人「起業家」。未来に向かって挑むその原動力は? 仕事における哲学は…? 時代をリードする起業家へのインタビュー『仕事論。』シリーズ。

今回お話を聞いたのは、「欲しい声が1秒で手に入る。」をコンセプトに、AI技術を活用し多彩な「声」をだれもが利用できるサービスを提供する、株式会社CoeFont代表 早川尚吾さんです。

フォントを変えるように、気軽に声を変えられたら。高校時代に学んだコンピュータサイエンスが起点

──起業に至った経緯をお聞かせください。

起業したのは大学1年のときです。でも、元々個人事業主として高校時代から様々な企業とともにモノをつくっていました

高校時代、スタンフォード大学のオンライン授業で機械学習やAIなどのコンピュータサイエンスを学びました。この知識を何かにいかしたいと思い「AI STYLIST」というアプリをつくったんです。

利用者の顔写真をもとに似合う髪型をAIが提案してくれるというもので、100万ダウンロードくらいまで利用者を伸ばしました。

こんな風に、自分でつくったものを人が使ってくれたら面白い! と感じていたのですが、次第に、続けるために「お金がかかる」ことに気づいたんです。

その後、ある上場企業のトップの方が「それはビジネスにしないとダメだよ」と教えてくれて。それで会社をつくったんです。

──「声」にフォーカスした事業を選んだ理由は?

元々ディープラーニングや機械学習を研究していたので、その中から音声をつくるのが面白いなと思いました。きっかけはライトなもので、元々自分の声が好きじゃなかったんですよね。

最初に音声AIの研究をしてみたところ、ディープラーニングの技術が発展していたので「これは頑張ればつくれるんじゃないか」と思ってつくったのがこのサービス。

CoeFont(コエフォント)」ってつまり「声のフォント」というイメージなんです。僕、自分の声も苦手だけど、字も汚くて(苦笑)。

あらたまった文書を作るときに、フォントをパッと明朝体にするような感じで、声をさっと変えられたらいいなって思ったんですよね。

一方で、声って、たった5分の動画にナレーションを入れるだけでお金も時間もずいぶんかかる。それがCoeFontだったらたったの1秒で、しかも人間の100分の1のコストでできるんです。しかも、声の種類もかわいい声から田原総一朗さんの声まで5000種類以上から選ぶことができる

利用者も増え、今は個人だけではなく企業でも使っていただいています

驚いたのはこの間、なんと東工大の売店でも使われていたんです。(※早川さんは現役の東工大生)。ちゃんと聞きやすい声のアナウンスになっていてびっくりしました。

声を失った人に「自分の声」を。社会で役立つ新しい可能性

──なるほど。いろんな声を提供するサービスは思いがけないところで新しい使い方が見つかりそうですね。

そうですね。最初は全く想定していなかったことですが、病気や事故で声を失った方が「自分の声」として利用してくださっています。

声帯を摘出された方やALSの方が、声を失う前に自分の声を収録しておけば、この技術を利用してずっと自分の声で話し続けることができるというのは新たな発見でした。

病や事故で声を失った方にはサービスを無償で提供することにしています。社会で役立つ可能性が見えてきたのは嬉しいですね。

──これほどのものを作り世に送り出すのは、並大抵のことではないですよね?

自分では大変だとは思っていないんじゃないかな。楽しいからやっているだけ、というところがあります。

もちろん、最初はもう本当に大変でしたね。どうやってできるのか全くわからなかった。でも、僕はちょっとでも何かを前に進められたら楽しいんですよね。

個人的にはこれを「クエスト」って呼んでます。仕事っていうとつまんなそうだけど、クエストって呼んだ方が自分のやってることに近いというか。仕事って思ったことはないんです。突き詰めると面白いからやっているんです。

「時間、地理、言語、身体を超えて声を届ける」ことで広がる自由な世界

──事業で目指すゴールは?

ビジョンとして持っているのは「時間、地理、言語、身体を超えて声を届ける」というもの。

時を超えて、亡くなった人の声を届けたり、言語の制約も受けず、どこにいても、好きな声で自由に表現できたらいいですよね。

メタバース空間で「美少女なのに声がおじさんでなんか変」みたいな問題も解決できます(笑)。

誰もが、好きな声でデジタル空間を楽しんだり、その人の本質を表現するような声や「こうありたい」と思っている声で存在できるわけです。

「時間、地理、言語、身体を超えて声を届ける」というのがこの事業で今やろうとしていることですね。

──その先にはどんな世界があるんでしょう?

誰もがもっと自由になるんじゃないですか。

例えば、YouTuberに必要な要素っていくつかあると思うんです。第一にコンテンツが面白いということ。第二にルックス=見た目。三つ目が声。

日本にはVTuberが多いですが、VTuberは見た目の問題を解決していますよね。だからコエフォント的なものが普及すれば、声も見た目も関係なくなってすごく自由になれる。つまり、誰もが自分が好きな見た目と声で本当に表現したいものを届けることができる。

個人単位でもやりたいことがやれて、なりたい自分になれる。音声が自動翻訳されて英語でも中国語でも自由に発信できたら言語の枠も乗り越えられますよね。そう考えると、メタバース的なものには結構貢献できるのかもしれません。

色んな人に思いもよらない使い方で使ってもらって、喜びの声とか、便利じゃん! とか言ってもらえると嬉しいんです。

自分が作ったものが社会に少しでも影響を与えられて、面白い未来を作るのに貢献できたっていうことは、すでに喜ぶべきことかなって思ってます。

尊敬する人物の考えを取り入れ、最適解を目指す

──ここからは一問一答形式でお話を伺います。まず、仕事をはじめるのは何時ですか? 終える時間は?

最近だと学校の課題で24時間アセンブラ書いてたときもあって…はじまる時間は学業次第です。終わる時間は決めていない。会食があると10時くらいに終わるけれど、そのあともSlack開いたりします。

──愛用デバイス、仕事道具は?

M1 Pro搭載のMacBook Proを使ってます。あと、もはやライフラインと呼びたいのが、Ankerの充電器。これがあれば一日中どこに行っても大丈夫。常に持ち歩くものは決めてあって、全てこのバッグに入れています。

服装を選ばないこのバッグを常に使うようにしていて、傷んできたら全く同じものを買います。

──情報収集はどのように行なっていますか?

決まった媒体があって、曜日ごとに何を読むか決めてあります。毎週、毎日というサイクルで読むものもある。

テレビは見ません。あとはTwitterでニュースサイトはフォローしてます。NewsPicksが結構好き。NewsPicksの特集があれば興味がないものも必ず読むことにしています。自分では普段取りに行かない新しい情報が入ってくるから。

──能力を伸ばすには?ビジネス力を伸ばすには?

情報収集は重要だと思います。「この人いいこと言ってるな」という言葉に出会ったらメモしています。尊敬している人が言っていることや考え方を取り入れていくことで、より正しい選択肢に近づいていったり、最適解に行き着くと考えています。

──余暇の過ごし方は?

うーん、元々この仕事も余暇からスタートしているんですよね。全てのタスクが完了したら、本を読んだり、映画やNetflix見たり。ゲームもやるし。サッカーとか冬はスキーに行ったりとかスポーツも好きです。

──心が折れたときはどうする?

心が折れるってことは、多分疲れているので寝たほうがいいと思ってます。寝るかコカコーラゼロを飲む。

──食生活で気をつけていること。好物は?

1日1食、基本夕食しかとらない。昼は食べると眠くなるし、人間が1日3食とるようになったのって最近じゃないですか。夕食でタンパク質をしっかり、野菜をたっぷりとって果物をとります。好物は辛いもの。麻婆豆腐とか。

──運動の習慣はありますか?どのような運動?

スポーツも楽しみますが、週一でジムに行っています。自分の限界ギリギリのきついメニューをこなして30分ぴったりで終える。

──ビジネスパーソンにおすすめの一冊は?

岩田さん 岩田聡はこんなことを話していた。』(株式会社ほぼ日

1日1、2冊くらい本を読みます。

──座右の銘は?

Done is better than perfect.

早川尚吾

2001年東京生まれ。幼少期をイギリスで過ごす。高校にて情報科学、特に、機械学習をスタンフォード大学の講義等で学ぶと同時に、個人事業主として働き始める。アースホールディングスと提携し、「AI Stylist」を企画・開発。19年、「アプリ甲子園」にて、第3位に入賞。20年、株式会社CoeFont(旧Yellston)、創業。現在は東京工業大学情報工学系に在学中。孫正義育英財団。

Source: CoeFont / Photo: 伊藤圭