Special Feature
国内企業の課題を生成AIで解決する 日本発大規模言語モデル
2023/06/19 09:00
週刊BCN 2023年06月19日vol.1973掲載
2022年11月の「ChatGPT」登場以来、「大規模言語モデル」を用いた生成AIへの注目が急速に高まっている。「専門家の仕事はAIによって代替される」とする脅威論や、経済安全保障の観点から「わが国も独自の生成AIを開発すべき」といった提言など、この技術をめぐってはさまざまな議論があるが、見逃すわけにいかないのが、現在のChatGPTは、企業が今まさに抱えているビジネス課題の解決には必ずしも最適とは言えない点だ。一方、生成AIの領域では、はじめから企業への導入を想定して研究開発を行ってきたプレイヤーが国内にも複数存在する。大規模言語モデルを取り巻く「日本発」の動きを取材した。
(取材・文/大畑直悠、大向琴音、日高 彰)
生成AIとしては昨年、指示内容に従って画像を出力する「Midjourney」「Stable Diffusion」などが話題となったが、テキストによる対話というかたちで、幅広い問いかけに対し、まるで人間が答えているような自然な表現で回答を出すサービスが登場し、人間が行ってきた知的生産活動の一定部分がAIによって置き換えられるのではないかという見方が急速に高まった。
政府は4月24日、AIの活用に関する課題を議論する「AI戦略チーム」の初会合を開催。会議の最初のテーマとなったのは、「ChatGPTなど生成系AIを利活用する場合の留意点」だった。4月29日から群馬県で開催されたG7デジタル・技術大臣会合、5月19日からのG7広島サミットでも、生成AIの可能性と、国際的なルール作りの必要性が議題となった。デジタルコンテンツを自動的に出力するサービス自体は新しいものではないが、ChatGPTの登場以降、「LLMという技術は今後の社会のあり方に大きな影響を与える」という見方は政財界を含む誰もが当たり前に持つ認識として広く共有された。
OpenAIだけでなくGoogle(グーグル)やMeta(メタ)など米国のビッグテックもLLMの開発を進めているが、国内でも独自の取り組みを進める企業がある。インターネット広告・デジタルコンテンツ大手のサイバーエージェントは5月、Wikipediaなどオープンな日本語データのベースとし、日本語に特化した独自のLLMを一般公開した(商用利用可能なクリエイティブ・コモンズ・ライセンスによる提供)。同社は既に、広告テキストの自動生成などにLLMを活用しているという。また、LLMの開発を手がけてきた国内スタートアップが注目を集めている。
オルツ
20年前後から独自のLLMの開発を手掛けてきたオルツは、同社のLLM「LHTM-2」やOpenAIの「GPT-3」を利用した事業支援、導入コンサルティング事業を展開している。人間の作業を代替することを目的に、人格を再現するAI技術「パーソナルAI」の開発を進めており、LLMはその実現に向けて重要な要素技術になるとみている。また、LHTM-2を搭載した自動議事録ツール「AI GIJIROKU」も提供している。
オルツ 西川 仁 執行役員CTO
執行役員の西川仁・CTOは、ChatGPT登場の意義について、「基礎技術自体はすでにあったが、それをチャットボットというユーザーインターフェースに落とし込むことで、LLMの有効な活用方法を提示した点にある」と指摘し、「(ChatGPTは)マーケティング的な成功という意味合いが強く、一番うまい出し方を一番初めにした」と分析する。その上で、西川CTOは「今後の市場における競争軸は、どのようなビジネスモデルが考えられるかという点にあるだろう」と展望する。
同社が開発するLLMのLHTM-2は、GPT-3と同水準の約1600億パラメーターを誇る。西川CTOはLHTM-2の特徴として、カスタマイズ性の高さを挙げ、「顧客の要望に合わせて必要十分な量に範囲を限定したデータを学習させた上で、教えていないことを推測で応答したり、拡大解釈した回答をしたりしないように、しっかりコントロールできる」と訴える。その上で「顧客の要望に合わせて一部のパラメーターだけを書き換えることもでき、エンタープライズ企業からの要求にも十分に合わせることが可能だ」とアピールする。ChatGPTは、あらゆる質問に対して自然に応答できるようになっている一方で、特定のユーザーにとって最適な回答を生成できるわけではない。西川CTOは「顧客の声を聞きながら、手元にあるプログラムを変更できることは大きな優位性だ」と強調する。
具体的な事例としては、西日本旅客鉄道(JR西日本)、JR西日本イノベーションズと、列車の運行ダイヤが乱れた際、運転整理を自動化する「鉄道指令業務アシストAI」の共同開発を行っている。すでに人間の司令員と同等か、それ以上の結果を出すことに成功しているという。
また、高い専門性が求められる医療分野では、ヘルステック企業のファストドクターと「医療AI-LHTM2」を共同開発している。医学書・過去問題集・模試といった範囲を限定した学習データと、臨床医による品質チェックや画像認識を組み合わせ、画像問題を含む医師国家試験の合格基準を超えることに成功している。今後は診療品質の向上や診療外業務の生産性向上に加え、病気の発症予測や早期発見に活用していくとしている。
現時点では直販で導入を広げているが、将来的には、パートナーの開拓も視野にいれているという。西川CTOは「エンジンやAPIだけオルツから提供し、プロダクトに落とし込むところをパートナーに担ってもらうということは当然あり得る。共同開発のような形になるのではないか」と話した。また「単にLLMを使いたいというだけではなく、LLMを使った特殊な切り口を考えているパートナーとご一緒したい」と訴えた。ELYZA
日本語特化の自然言語処理エンジン「ELYZA Brain」を開発するELYZAの曽根岡侑也CEOは「これまでは大規模言語AIの導入を足踏みしている人たちも多かったが、今年の4月上旬ごろからは風向きが変わった」と話す。
ELYZA 曽根岡侑也 CEO
昨年の後半ごろまでは、LLMについて知っている人はごく一部に限られていたが、昨年11月にChatGPTが出てからは、LLMについての認知が広がった。
また、今年4月には国内のメガバンク3社がLLMを活用すると発表したことで、社会におけるLLM活用が現実味を帯び、引き合いも増えていると指摘する。元々は大企業や、LLMという技術をリサーチしている人からの“未来投資”的な意味合いでの引き合いが多かったが、現在は大企業に限らず多様な規模の企業から話を持ちかけられるようにもなっており、実用的な要望が増加しているという。
自然言語に対応するAI製品は以前から存在したが、精度の問題から「『自然言語を扱うAIは使い物にならない』と言う人は多かった」(曽根岡CEO)。
しかし、18年ごろからLLMを実装した技術が広がり、性能が大きく向上した。例えば翻訳AIでは、精度を人間並みにするには数十億個の教師データが必要とされていたが、LLMで言語を「事前学習」させた後では、教師データは数万個程度で済むようになった。LLMの登場は、企業が自社のサービスや業務にAIを導入する難易度を下げる要因になったと曽根岡CEOはみる。
同社は、ELYZA Brainの研究開発だけでなく、OpenAIの技術を含むさまざまなAIモデルを活用した業務改善に取り組んでおり「自社モデルだけにこだわりがあるわけではない」(曽根岡CEO)。しかし、他社のAIに依存しない自社モデルが必要となるケースは少なくないという。
一つめは、個人情報などを扱うためポリシーが厳しい場合。OpenAIのサーバーなど他社のクラウドに機密情報を載せたくないというニーズだ。二つめは、産業機械や自動車など、エッジで処理することが求められる場合。高性能なサーバーをエッジ側に設置できない環境では、高精度でありつつ小さなリソースでも処理できるAIモデルにニーズがある。そして一番引き合いが多いのは、製薬や医療など専門用語が多いケースだ。細かいルールや専門の言い回しがある業務に対しては、汎用的なサービスであるChatGPTが出力した回答はそのまま使えず、人の手で細かな修正を加える必要があるケースが多いという。
加えて曽根岡CEOは、ChatGPTなどのAIモデルを動かすためのGPUが世界的に不足していることや、電力供給枠を確保するためのリードタイムの都合で、コンピューティングリソースの取り合いが世界的に発生していることを指摘する。「既に計算資源を無尽蔵に使える状況ではなくなっている。ChatGPTなどに投げる前に自社のAIモデルでリクエストを圧縮するなど、工夫の余地が生まれている」とし、グローバルプレイヤーのエンジンだけに依存するのではなく、自社の小さいモデルと使い分ける動きが起きると予想する。
曽根岡CEOは「全社員にChatGPTなどのUIを配って、とにかく幅広くLLMを使うという方法では、業務を効率化できるとは限らないし、何よりコストがかかるということに気付く。各企業が、自社の業務に特化した活用方法を選択するようになるだろう」と述べ、世界レベルでの競争が繰り広げられる一方で、ビジネス課題を解決するという観点では、ビッグテックに依存しない独自のAIモデルへのニーズも今後高まるとの見方を示す。LLMは“ChatGPTか国産か”と二元論的に選択するものではなく、オープンソース製品も含めた多様な選択肢が登場し、用途に応じた水平分業が進んでいくものと考えられる。
(取材・文/大畑直悠、大向琴音、日高 彰)

急速に広がった「LLMは世界を変える」認識
米Microsoft(マイクロソフト)などの出資を受けてAIを開発する米OpenAI(オープンエーアイ)が、対話型AIサービスの「ChatGPT」を公開したことで、大規模言語モデル(LLM:Large Language Models)を活用した生成AIが一躍脚光を浴びた。生成AIとしては昨年、指示内容に従って画像を出力する「Midjourney」「Stable Diffusion」などが話題となったが、テキストによる対話というかたちで、幅広い問いかけに対し、まるで人間が答えているような自然な表現で回答を出すサービスが登場し、人間が行ってきた知的生産活動の一定部分がAIによって置き換えられるのではないかという見方が急速に高まった。
政府は4月24日、AIの活用に関する課題を議論する「AI戦略チーム」の初会合を開催。会議の最初のテーマとなったのは、「ChatGPTなど生成系AIを利活用する場合の留意点」だった。4月29日から群馬県で開催されたG7デジタル・技術大臣会合、5月19日からのG7広島サミットでも、生成AIの可能性と、国際的なルール作りの必要性が議題となった。デジタルコンテンツを自動的に出力するサービス自体は新しいものではないが、ChatGPTの登場以降、「LLMという技術は今後の社会のあり方に大きな影響を与える」という見方は政財界を含む誰もが当たり前に持つ認識として広く共有された。
OpenAIだけでなくGoogle(グーグル)やMeta(メタ)など米国のビッグテックもLLMの開発を進めているが、国内でも独自の取り組みを進める企業がある。インターネット広告・デジタルコンテンツ大手のサイバーエージェントは5月、Wikipediaなどオープンな日本語データのベースとし、日本語に特化した独自のLLMを一般公開した(商用利用可能なクリエイティブ・コモンズ・ライセンスによる提供)。同社は既に、広告テキストの自動生成などにLLMを活用しているという。また、LLMの開発を手がけてきた国内スタートアップが注目を集めている。
オルツ
カスタマイズ性の高さを訴求
20年前後から独自のLLMの開発を手掛けてきたオルツは、同社のLLM「LHTM-2」やOpenAIの「GPT-3」を利用した事業支援、導入コンサルティング事業を展開している。人間の作業を代替することを目的に、人格を再現するAI技術「パーソナルAI」の開発を進めており、LLMはその実現に向けて重要な要素技術になるとみている。また、LHTM-2を搭載した自動議事録ツール「AI GIJIROKU」も提供している。
執行役員の西川仁・CTOは、ChatGPT登場の意義について、「基礎技術自体はすでにあったが、それをチャットボットというユーザーインターフェースに落とし込むことで、LLMの有効な活用方法を提示した点にある」と指摘し、「(ChatGPTは)マーケティング的な成功という意味合いが強く、一番うまい出し方を一番初めにした」と分析する。その上で、西川CTOは「今後の市場における競争軸は、どのようなビジネスモデルが考えられるかという点にあるだろう」と展望する。
同社が開発するLLMのLHTM-2は、GPT-3と同水準の約1600億パラメーターを誇る。西川CTOはLHTM-2の特徴として、カスタマイズ性の高さを挙げ、「顧客の要望に合わせて必要十分な量に範囲を限定したデータを学習させた上で、教えていないことを推測で応答したり、拡大解釈した回答をしたりしないように、しっかりコントロールできる」と訴える。その上で「顧客の要望に合わせて一部のパラメーターだけを書き換えることもでき、エンタープライズ企業からの要求にも十分に合わせることが可能だ」とアピールする。ChatGPTは、あらゆる質問に対して自然に応答できるようになっている一方で、特定のユーザーにとって最適な回答を生成できるわけではない。西川CTOは「顧客の声を聞きながら、手元にあるプログラムを変更できることは大きな優位性だ」と強調する。
具体的な事例としては、西日本旅客鉄道(JR西日本)、JR西日本イノベーションズと、列車の運行ダイヤが乱れた際、運転整理を自動化する「鉄道指令業務アシストAI」の共同開発を行っている。すでに人間の司令員と同等か、それ以上の結果を出すことに成功しているという。
また、高い専門性が求められる医療分野では、ヘルステック企業のファストドクターと「医療AI-LHTM2」を共同開発している。医学書・過去問題集・模試といった範囲を限定した学習データと、臨床医による品質チェックや画像認識を組み合わせ、画像問題を含む医師国家試験の合格基準を超えることに成功している。今後は診療品質の向上や診療外業務の生産性向上に加え、病気の発症予測や早期発見に活用していくとしている。
現時点では直販で導入を広げているが、将来的には、パートナーの開拓も視野にいれているという。西川CTOは「エンジンやAPIだけオルツから提供し、プロダクトに落とし込むところをパートナーに担ってもらうということは当然あり得る。共同開発のような形になるのではないか」と話した。また「単にLLMを使いたいというだけではなく、LLMを使った特殊な切り口を考えているパートナーとご一緒したい」と訴えた。
ELYZA
用途ごとにLLMを使い分ける
日本語特化の自然言語処理エンジン「ELYZA Brain」を開発するELYZAの曽根岡侑也CEOは「これまでは大規模言語AIの導入を足踏みしている人たちも多かったが、今年の4月上旬ごろからは風向きが変わった」と話す。
昨年の後半ごろまでは、LLMについて知っている人はごく一部に限られていたが、昨年11月にChatGPTが出てからは、LLMについての認知が広がった。
また、今年4月には国内のメガバンク3社がLLMを活用すると発表したことで、社会におけるLLM活用が現実味を帯び、引き合いも増えていると指摘する。元々は大企業や、LLMという技術をリサーチしている人からの“未来投資”的な意味合いでの引き合いが多かったが、現在は大企業に限らず多様な規模の企業から話を持ちかけられるようにもなっており、実用的な要望が増加しているという。
自然言語に対応するAI製品は以前から存在したが、精度の問題から「『自然言語を扱うAIは使い物にならない』と言う人は多かった」(曽根岡CEO)。
しかし、18年ごろからLLMを実装した技術が広がり、性能が大きく向上した。例えば翻訳AIでは、精度を人間並みにするには数十億個の教師データが必要とされていたが、LLMで言語を「事前学習」させた後では、教師データは数万個程度で済むようになった。LLMの登場は、企業が自社のサービスや業務にAIを導入する難易度を下げる要因になったと曽根岡CEOはみる。
同社は、ELYZA Brainの研究開発だけでなく、OpenAIの技術を含むさまざまなAIモデルを活用した業務改善に取り組んでおり「自社モデルだけにこだわりがあるわけではない」(曽根岡CEO)。しかし、他社のAIに依存しない自社モデルが必要となるケースは少なくないという。
一つめは、個人情報などを扱うためポリシーが厳しい場合。OpenAIのサーバーなど他社のクラウドに機密情報を載せたくないというニーズだ。二つめは、産業機械や自動車など、エッジで処理することが求められる場合。高性能なサーバーをエッジ側に設置できない環境では、高精度でありつつ小さなリソースでも処理できるAIモデルにニーズがある。そして一番引き合いが多いのは、製薬や医療など専門用語が多いケースだ。細かいルールや専門の言い回しがある業務に対しては、汎用的なサービスであるChatGPTが出力した回答はそのまま使えず、人の手で細かな修正を加える必要があるケースが多いという。
加えて曽根岡CEOは、ChatGPTなどのAIモデルを動かすためのGPUが世界的に不足していることや、電力供給枠を確保するためのリードタイムの都合で、コンピューティングリソースの取り合いが世界的に発生していることを指摘する。「既に計算資源を無尽蔵に使える状況ではなくなっている。ChatGPTなどに投げる前に自社のAIモデルでリクエストを圧縮するなど、工夫の余地が生まれている」とし、グローバルプレイヤーのエンジンだけに依存するのではなく、自社の小さいモデルと使い分ける動きが起きると予想する。
曽根岡CEOは「全社員にChatGPTなどのUIを配って、とにかく幅広くLLMを使うという方法では、業務を効率化できるとは限らないし、何よりコストがかかるということに気付く。各企業が、自社の業務に特化した活用方法を選択するようになるだろう」と述べ、世界レベルでの競争が繰り広げられる一方で、ビジネス課題を解決するという観点では、ビッグテックに依存しない独自のAIモデルへのニーズも今後高まるとの見方を示す。LLMは“ChatGPTか国産か”と二元論的に選択するものではなく、オープンソース製品も含めた多様な選択肢が登場し、用途に応じた水平分業が進んでいくものと考えられる。
2022年11月の「ChatGPT」登場以来、「大規模言語モデル」を用いた生成AIへの注目が急速に高まっている。「専門家の仕事はAIによって代替される」とする脅威論や、経済安全保障の観点から「わが国も独自の生成AIを開発すべき」といった提言など、この技術をめぐってはさまざまな議論があるが、見逃すわけにいかないのが、現在のChatGPTは、企業が今まさに抱えているビジネス課題の解決には必ずしも最適とは言えない点だ。一方、生成AIの領域では、はじめから企業への導入を想定して研究開発を行ってきたプレイヤーが国内にも複数存在する。大規模言語モデルを取り巻く「日本発」の動きを取材した。
(取材・文/大畑直悠、大向琴音、日高 彰)
生成AIとしては昨年、指示内容に従って画像を出力する「Midjourney」「Stable Diffusion」などが話題となったが、テキストによる対話というかたちで、幅広い問いかけに対し、まるで人間が答えているような自然な表現で回答を出すサービスが登場し、人間が行ってきた知的生産活動の一定部分がAIによって置き換えられるのではないかという見方が急速に高まった。
政府は4月24日、AIの活用に関する課題を議論する「AI戦略チーム」の初会合を開催。会議の最初のテーマとなったのは、「ChatGPTなど生成系AIを利活用する場合の留意点」だった。4月29日から群馬県で開催されたG7デジタル・技術大臣会合、5月19日からのG7広島サミットでも、生成AIの可能性と、国際的なルール作りの必要性が議題となった。デジタルコンテンツを自動的に出力するサービス自体は新しいものではないが、ChatGPTの登場以降、「LLMという技術は今後の社会のあり方に大きな影響を与える」という見方は政財界を含む誰もが当たり前に持つ認識として広く共有された。
OpenAIだけでなくGoogle(グーグル)やMeta(メタ)など米国のビッグテックもLLMの開発を進めているが、国内でも独自の取り組みを進める企業がある。インターネット広告・デジタルコンテンツ大手のサイバーエージェントは5月、Wikipediaなどオープンな日本語データのベースとし、日本語に特化した独自のLLMを一般公開した(商用利用可能なクリエイティブ・コモンズ・ライセンスによる提供)。同社は既に、広告テキストの自動生成などにLLMを活用しているという。また、LLMの開発を手がけてきた国内スタートアップが注目を集めている。
(取材・文/大畑直悠、大向琴音、日高 彰)

急速に広がった「LLMは世界を変える」認識
米Microsoft(マイクロソフト)などの出資を受けてAIを開発する米OpenAI(オープンエーアイ)が、対話型AIサービスの「ChatGPT」を公開したことで、大規模言語モデル(LLM:Large Language Models)を活用した生成AIが一躍脚光を浴びた。生成AIとしては昨年、指示内容に従って画像を出力する「Midjourney」「Stable Diffusion」などが話題となったが、テキストによる対話というかたちで、幅広い問いかけに対し、まるで人間が答えているような自然な表現で回答を出すサービスが登場し、人間が行ってきた知的生産活動の一定部分がAIによって置き換えられるのではないかという見方が急速に高まった。
政府は4月24日、AIの活用に関する課題を議論する「AI戦略チーム」の初会合を開催。会議の最初のテーマとなったのは、「ChatGPTなど生成系AIを利活用する場合の留意点」だった。4月29日から群馬県で開催されたG7デジタル・技術大臣会合、5月19日からのG7広島サミットでも、生成AIの可能性と、国際的なルール作りの必要性が議題となった。デジタルコンテンツを自動的に出力するサービス自体は新しいものではないが、ChatGPTの登場以降、「LLMという技術は今後の社会のあり方に大きな影響を与える」という見方は政財界を含む誰もが当たり前に持つ認識として広く共有された。
OpenAIだけでなくGoogle(グーグル)やMeta(メタ)など米国のビッグテックもLLMの開発を進めているが、国内でも独自の取り組みを進める企業がある。インターネット広告・デジタルコンテンツ大手のサイバーエージェントは5月、Wikipediaなどオープンな日本語データのベースとし、日本語に特化した独自のLLMを一般公開した(商用利用可能なクリエイティブ・コモンズ・ライセンスによる提供)。同社は既に、広告テキストの自動生成などにLLMを活用しているという。また、LLMの開発を手がけてきた国内スタートアップが注目を集めている。
この記事の続き >>
- オルツ カスタマイズ性の高さを訴求
- ELYZA 用途ごとにLLMを使い分ける
続きは「週刊BCN+会員」のみ
ご覧になれます。
(登録無料:所要時間1分程度)
新規会員登録はこちら(登録無料) ログイン会員特典
- 注目のキーパーソンへのインタビューや市場を深掘りした解説・特集など毎週更新される会員限定記事が読み放題!
- メールマガジンを毎日配信(土日祝をのぞく)
- イベント・セミナー情報の告知が可能(登録および更新)
SIerをはじめ、ITベンダーが読者の多くを占める「週刊BCN+」が集客をサポートします。 - 企業向けIT製品の導入事例情報の詳細PDFデータを何件でもダウンロードし放題!…etc…
- 1
