オランダ、GPT-NL を実験室から実稼働環境に移行: 最初のパイロットが進行中 |毎週のコンピューティング

オランダ、GPT-NL を実験室から実稼働環境に移行: 最初のパイロットが進行中 |毎週のコンピューティング


オランダはビッグテックが人工知能(AI)問題を解決するのを待っているわけではない。 2月末以来、5つの組織が、応用研究機関TNO、オランダ法医学研究所、オランダの教育研究機関のIT協同組合であるSURFが開発した国語モデルであるGPT-NLのベータ版を使った実現可能性調査を実施している。

その数は2026年春までに10社に増えると予想されており、今年下半期にはさらに広範囲の商業発売が予定されている。

この動きは、2023年後半に開始された当初は健全な懐疑的な見方をされていたプロジェクトにとって、大きな変化を示すものとなる。ビッグテックの標準によると四捨五入誤差である初期予算では、GPT-NL が単なる研究成果物ではなく、組織が実装できるモデルとして本当に役立つものを提供できるかどうかが常に問題でした。 2026 年 2 月に発行された進捗報告書は、プロジェクトがその目標に近づいていることを示唆しています。

前回のトレーニングから実践まで

モデルの事前トレーニングを完了します。 GPT-NL R&D マネージャーの Frank Brinkkemper 氏によると、進捗レポートの中で、最初のベンチマーク結果は心強いものであると述べています。要約タスクでは、GPT-NL はすでに GPT-3 などの古いモデルを上回っており、リソースの違いを考慮すると顕著です。 EuroEval などの標準ベンチマークはパフォーマンスの測定に使用されており、ベンチマークがオランダ語用に完全に調整されていない場合には補正が適用されます。

現在進行中の実現可能性調査は、より困難な質問に答えるように設計されています。モデルは、実際のインフラストラクチャ上で、実際のタスクに実際に耐えられるか?各ローンチカスタマーは、施設にモデルを設置し、3 ~ 6 か月にわたって一連のテストを実行し、特定のユースケースに向けて反復する TNO チームと連携します。顧客はリサーチ プログラムの料金を支払いますが、これにはスタッフの勤務時間、ライセンス、およびオプションのコミュニティ料金が含まれますが、より広範な市場での最終価格はまだ設定されていません。

特に最初の 5 人の参加者は公開市場の出身者ではありません。 3 つのユースケースはオランダ内務王国関係省から資金提供されており、残りの 2 つは TNO と NFI です。プロジェクトの開始者との距離の近さ自体は現実的な選択肢ですが、これは広範な分野の関連性の主張が次の段階でより厳密にテストされることを意味します。

テストされているアプリケーションは、公共部門のさまざまな機能をカバーしています。パイロットの 1 つは、オランダのほぼ 30 の自治体ですでに使用されている仮想自治体アシスタントである Gem を使用しており、2024 年には約 70,000 件の会話を処理しました。現在調査されている問題は、GPT-NL が現在実装されているモデルと比較して、住民の質問に対する Gem の応答の質を向上させるかどうかです。

2 番目の使用例は、HIP に焦点を当てています。HIP は、その名前を大まかに訳すと、明確、インテリジェント、生産的という意味のコミュニケーション アシスタントです。このツールは、役人が平易な言葉で政府の手紙を書くのに役立ちます。これはオランダの行政における根深い課題であり、借金や給付金に関する通信は国民にとって理解が難しいことで知られています。 GPT-NL は現在展開されている商用モデルと比較されています。

NFI では、処理速度と精度が刑事訴追に直接影響を与える分野である、テラバイト規模の証拠を含む捜査における分類パフォーマンスを向上させるために、法医学データに基づいてモデルを微調整しています。 TNO はまた、独自の機密でプライバシーに配慮した研究プロジェクトのために、「Copilot, until until if not」ポリシーに基づいて内部で GPT-NL をテストしています。これは、商用 AI ツールがデフォルトであることを意味しますが、データの機密性が必要な場合には GPT-NL が機能します。

世界初の著作権ライセンス

おそらく、昨年の国際的に最も重要な発展は技術的なものではなく、法的なものです。 GPT-NL は、全国紙、NU.nl や RTL ニュースなどのプラットフォーム、放送局 BNR をカバーするオランダの商業ニュース出版社協会である NDP とライセンス契約を締結しました。 GPT-NL は、モデル トレーニングでのコンテンツの使用について、単一のマーケットプレイスですべての主要なパブリッシャーと合意に達し、有料の合意に達した世界初の AI イニシアチブであると主張しています。

合意は簡単には成立しなかった。大規模言語モデル (LLM) の時代において、メディアは他のメディアよりも失うものが多くなっています。メディアのコンテンツは許可なく大規模にスクレイピングされ、ジャーナリズムと直接競合する出力を生成するために使用されています。

NDPニュースメディアのリエン・ファン・ベーメン会長は報告書の中で、「われわれはオランダにおけるジャーナリズムの立場を長期的に強化する前例を作った」と述べた。 「人工知能のイノベーションは、ジャーナリストの著作物を大規模に違法に利用することなく、倫理的に実現することができる。」

モデル コンテンツの復活に関するパブリッシャーの懸念に対処するために、GPT-NL には、ライセンスされた素材が通知を通じて抽出されるのを防ぐ技術的手段が含まれています。すべてのライセンス条項は公的に文書化されており、フレームワークではコンテンツの削除が許可されていますが、オンデマンド モデルの継続的なリサイクルは技術的に不可能であるとチームは率直に述べています。代わりに、プロジェクトを終了したデータプロバイダーは、モデルの新しいバージョンがリリースされるまで報酬を受け取り続けます。

GPT-NLプロダクトマネージャーのサスキア・レンシンク氏によると、このアプローチはオランダ国外からも注目を集めている、「他の欧州加盟国は、官民の協力団体のエコシステムが法的、組織的にどのように構成されているのか疑問に思っている。我が国は、出版社と共同で合意に達することに成功した世界初の国だ。」

主権論

GPT-NL の基礎は、デジタル自律性に関する戦略的議論です。ヨーロッパの政府、公的機関、企業は、主に欧州以外のクラウド プラットフォーム、オフィス ソフトウェア、人工知能ツールを使用して運営されています。 GPT-NL は、非営利の公共部門組織 (TNO、SURF、NFI) を基盤としていますが、レンシンク氏が指摘するように、これらの組織は決して米国企業になることはありません。

ティルブルフ大学のグローバル ICT 法の教授であり、法的アーキテクチャについてプロジェクトに助言を行ったモリソン・フェルスター社のパートナーであるロッケ・モレル氏は、これを戦略的必要性として位置づけています。 「他人が構築したテクノロジーのルールだけを作成すると、常に出来事を追いかけることになります」と彼女は報告書の中で述べています。 「自分で技術を構築する必要があります。そうしないと、外国のサプライヤーに依存し続けることになり、交渉の余地がありません。」

モレル氏は、プロジェクトの現状についても現実的です。 「これはある意味、まだスタートアップです。本当の挑戦はこれから始まります。これを拡張可能なもの、構造的に社会の一部となるものにするにはどうすればよいでしょうか?」

彼女は、オランダでより広範に見られるパターンを指摘しています。それは、実験には強く、継続的な投資をやり遂げることには消極的であるということです。 「今こそ、前進すべき時だ」と彼は付け加えた。

野心と資源との間の緊張は明白です。複数の組織にまたがる約 25 人のチームは、現在標準ベンチマークで十分なパフォーマンスを発揮するものを構築しましたが、それをフロンティア モデルを補完または競合できるように拡張するには、1,350 万ユーロではカバーできないレベルの継続的な投資が必要になります。モデルの重みは完全にオープンソースではありません。これらはリクエストに応じて利用可能であり、助成金の条件に応じて継続的な運営費を回収できるようにコストが構成されています。

2026 年後半には、プロフェッショナル ライセンスによる広範な展開が目標とされており、ホスト型の SaaS (Software-as-a-Service) オプションも開発中です。チームはまた、多言語機能と改善された音声サポートを備えた次世代モデルも検討しています。短期的には、強化された Recovery Augmented Generation (RAG) 機能がロードマップにあります。

GPT-NL v1.0 のトレーニング データセットは、使用されている著作権で保護されたコンテンツに関するメタデータを含め、HuggingFace で公開されるように構成されており、トレーニング データの構成に関する完全な透明性を提供します。一方、NDP Nieuwsmedia、TNO、VNO-NCW、国立図書館を含む広範な連合は、責任あるAIの導入を加速するためのデータ政策に関する正式なビジョンを策定するようオランダ内閣に要請した。

予算が控えめな小規模チームがその状況を維持できるかどうかは、次のドライバーの波が何をもたらすかにかかっています。この出版社との契約は、オランダが他の誰もできなかったことを実現できることを証明した。ここで問題となるのは、そのモデル自体が組織にとって、原則ではなくパフォーマンスに基づいて代替モデルよりもそのモデルを選択するのに十分であるかどうかです。

Leave a Reply

Your email address will not be published. Required fields are marked *