AI(人工知能)が私たちの生活や社会に深く浸透し、その進化のスピードは驚くべきものがあります。特に大規模言語モデル(LLM)は、私たちの情報収集、コミュニケーション、そしてビジネスのあり方を根本から変えつつある、21世紀で最も革新的な技術の一つと言えるでしょう。
しかし、その急速な発展の裏で、AIの透明性や倫理、そして多様性に関する議論も活発に行われています。そのような状況の中、スイスから「Apertus(アペルタス)」という、透明性と多言語対応を核とした画期的な大規模言語モデルが登場しました。
Apertusは、単なる新しいAIモデルというだけでなく、これまでのAI開発の常識に一石を投じる存在として、世界中から注目を集めています。なぜApertusがこれほどまでに期待されているのか、その全貌を本記事で詳しく解説していきます。
Apertus(アペルタス)とは?スイス発のオープンで多言語対応LLMの全貌
(出典:ETH AI Center & EPFL AI Center)
Apertusは、スイス連邦工科大学ローザンヌ校(EPFL)、チューリッヒ工科大学(ETH Zürich)、そしてスイス国立スーパーコンピューティングセンター(CSCS)が共同で開発し、リリースしたスイス初の大規模なオープン・多言語言語モデルです。その名前はラテン語で「開いている」を意味し、その名の通り、開発プロセス全体が完全に公開され、詳細に文書化されていることが最大の特徴です。
Apertusは、AIの透明性と多様性における重要なマイルストーンとして位置づけられています。具体的には、以下の特徴を持っています。
- 完全なオープンソースモデル
Apertusは、モデルのアーキテクチャ、モデルウェイト、トレーニングデータ、そしてトレーニングレシピ(訓練方法)まで、すべてがオープンにアクセス可能で、詳細な技術レポートと共に公開されています。これにより、開発者や研究者がモデルの内部を完全に検証し、トレーニングプロセスを再現できる環境が提供されています。これは、信頼性の高いAIモデルを開発するための青写真を提供する試みです。 - 大規模なパラメータ数とトレーニングトークン
700億パラメータという大規模なモデルは、オープンソースモデルのカテゴリにおいては非常に大きく、15兆トークンという膨大なデータでトレーニングされています。これにより、既存のオープンソースモデルの中でも際立った存在となっています。また、個人利用に適した80億パラメータの小型モデルも提供されています。 - 広範な多言語対応
Apertusは、世界のグローバルコミュニティのニーズに応えることを目標に、非常に多くの言語でトレーニングされています。特に、1,000以上の言語、具体的には1,811の言語をネイティブにサポートしており、トレーニングデータの40%が非英語データで構成されています。これには、スイスドイツ語やロマンシュ語といった、これまで大規模言語モデルで十分に表現されてこなかった言語が多く含まれています。 - 高いデータコンプライアンスと倫理基準
Apertusは、スイスのデータ保護法、著作権法、およびEU AI Actの透明性義務を十分に考慮して開発されました。トレーニングコーパスは公開データのみで構築され、ウェブサイトからの機械読取り可能なオプトアウトリクエストに遡及的に対応し、個人データや望ましくないコンテンツはトレーニング開始前に除去されています。また、トレーニングデータの記憶を防ぐ独自の技術も開発・適用されており、これは責任あるモデル開発に向けた重要なステップとされています。 - 許容性の高いオープンソースライセンス
Apertusは、Apache 2.0などの許容性の高いオープンソースライセンスの下でリリースされており、教育や研究目的だけでなく、幅広い社会・商業アプリケーションでの利用が可能です。
Apertusは、汎用AIアシスタントの代替ではなく、研究者や開発者がその上に独自のソリューションを構築するための興味深いプラットフォームとして期待されています。
Apertusはスイスが国家プロジェクトとして推進するAI
(出典:CSCS – Swiss National Supercomputing Centre)
Apertusは、スイスがAI分野におけるデジタル主権と公共の利益を追求するために、国家レベルで推進するプロジェクトの成果です。これは、EPFLとETH Zürichが主導する「スイスAIイニシアティブ」の一環として開発されました。
このプロジェクトは、スイス国内の研究者、エンジニア、学生が協力して行われ、スイス国立スーパーコンピューティングセンター(CSCS)のエンジニアとインフラも活用されています。特に、CSCSのスーパーコンピューター「Alps」に1,000万GPU時間以上の投資を行い、その開発と研究が進められました。
Apertusは、スイスの中立性をAI戦略に反映させ、「AIを公共財として扱う」というアプローチを体現しています。これにより、巨大な商業プロバイダーが主導するAIソリューションに対する代替選択肢を提供し、信頼できるAIモデルの開発方法の青写真を示すことを目指しています。スイス政府はAI研究開発の資金提供も行っており、この分野における国家的なリーダーシップを示しています。
GeminiやChatGPTとは何が違う?Apertus独自の強み
Apertusのユニークな立ち位置を理解するには、現在広く利用されている他の主要なAIモデル、例えばGoogleのGeminiやOpenAIのChatGPTと比較することが有効です。
ChatGPT(チャットGPT)の概要
ChatGPTは、OpenAIが開発したAIチャットボットで、2022年11月に公開されて以来、その自然な会話能力で世界的な注目を集めました。リリース後わずか2ヶ月でユーザー数が1億人を突破するほどの人気を博し、テキスト生成、翻訳、要約、プログラミング支援など、多岐にわたるタスクを得意としています。
- 無料版と有料版
現在、ChatGPTには複数の有料プランがあります。基本的な機能は無料版でも利用できますが、有料のChatGPT Plusに加入すると、最新モデルであるGPT-5をより多く利用できるほか、画像生成AIのDALL·E 3や動画生成AIのSora、ファイルアップロードやデータ分析機能など、より高度な機能を利用できるようになります。また、混雑時でも優先的にアクセスできるため、応答速度が向上し、より快適に利用できます。 - 企業向けソリューション
企業向けの有料プランとして、ChatGPT TeamとChatGPT Enterpriseが提供されています。これらのプランは、情報漏洩リスクの低減やセキュリティの強化、最新のモデルであるGPT-5への無制限アクセスなど、ビジネス利用に特化した様々な機能が備わっています。
Gemini(ジェミニ)の概要
Geminiは、Googleが開発した高性能なAIモデル群であり、テキスト、画像、音声、動画の生成、さらにはプログラミングといった、マルチモーダルな能力を最大の特徴としています。
- Googleサービスとの強力な連携
GeminiはGoogleが開発したAIであるため、YouTube、Gmail、Google Drive、Google Calendarなど、Googleの多岐にわたるサービスとの連携が非常に強力です。これにより、メールの自動返信、旅行計画の作成とGoogleマップ連携、Googleカレンダーへのスケジュール自動登録、Googleドライブ内のファイル検索と要約などが可能です。 - モデルの種類とアクセス
主に「Gemini 2.5 Pro」「Gemini 2.5 Flash」「Gemini 2.5 Flash Light」の3種類のモデルがあり、Gemini 2.5 Proは世界最高峰のモデルとして評価されています。無料アカウントでもGemini 2.5 Proを利用できますが、利用制限があります。 - 特徴的な機能
- Gemini Live
モバイルアプリで音声対話が可能で、マイク入力だけでなく、映し出された景色や見ているウェブサイトの解析も行えます。 - Deep Research
インターネット上の情報を人間のように収集、分析、整理し、レポートを作成する機能です。 - Canvas
インタラクティブなスペースで、文書やコードの作成、長さやトーンの変更、Geminiへの相談などが可能です。 - Gems
カスタム指示や追加知識を定義することで、Geminiの機能を拡張し、自分だけのAIアシスタントを作成できる機能です。
- Gemini Live
Apertusとの比較
(出典:EPFL)
Apertus、ChatGPT、Geminiはそれぞれ異なる目標とアプローチを持つAIモデルです。Apertusの独自の強みは以下の点に集約されます。
- 圧倒的な透明性とオープン性
Apertusは、モデルウェイト、トレーニングデータ、トレーニング方法、中間チェックポイント、さらにはトレーニングデータ再構築スクリプトまで、すべてを公開しています。これは、一部のコンポーネントのみを公開するDeepSeekのようなモデルや、よりクローズドなアプローチを取るChatGPTやGeminiとは一線を画します。この完全な透明性により、研究者や開発者はモデルの動作原理を深く理解し、信頼性を高め、自身のプロジェクトに安全に組み込むことができます。 - グローバルな多言語対応とマイノリティ言語の重視
Apertusは、1,811もの言語をネイティブにサポートし、そのトレーニングデータの40%以上が非英語で構成されています。特にスイスの公用語(ドイツ語、フランス語、イタリア語、ロマンシュ語)に加えて、スイスドイツ語など、これまで他のLLMでは十分に表現されてこなかった言語への対応を強化しています。これは、グローバルコミュニティ全体、特に商業LLMからサービスが行き届いていない地域のユーザーに役立つことを目的としています。 一方で、スイス文化に根ざした多言語応答や、50以上の言語への翻訳で優れた多言語性を示しました。しかし、ユーザーからのフィードバックの中には、フランス語、ドイツ語、フィンランド語、ブルガリア語といった一部の言語でのパフォーマンスが期待外れだったという意見もあります。 - データコンプライアンスと倫理への厳格な対応
Apertusは、スイスのデータ保護法、著作権法、そしてEU AI Actの透明性義務に準拠して開発されました。公開データのみをトレーニングに利用し、ウェブサイトからのオプトアウトリクエストを尊重するフィルタリング、個人データや不適切なコンテンツの除去、さらにはトレーニングデータの記憶を防ぐ技術を導入しています。これは、責任あるAIモデルの開発において、法的な要件と倫理的な基準を最高レベルで満たそうとする姿勢を示しています。 - 研究・開発プラットフォームとしての位置づけ
Apertusは、既存の汎用AIアシスタントの直接的な代替を目指すものではありません。むしろ、研究者や開発者がその上に、チャットボット、翻訳システム、教育ツールなどの多様なアプリケーションを構築できる「基礎技術」としての役割を果たすことを意図しています。AIイノベーションエコシステムの発展を促進することが、その主要な目標の一つです。
Apertusの現在のパフォーマンスについては、Redditのユーザーコミュニティからは様々な意見が聞かれます。プリトレーニングのスコアは良好であるものの、ポストトレーニングのスコアは他の小型モデルに劣るという指摘や、クリエイティブな文章作成や一部の言語での能力に課題があるという声もあります。しかし、これはプロジェクトの最初のモデルであり、今後の改善と進化に大きな期待が寄せられています。
Apertusを実際に使うには?アクセス方法と推奨設定
(出典:Hugging Face)
Apertusは、そのオープンな性質から、研究者や開発者が多様な方法でアクセスし、利用できる設計となっています。
Apertusへのアクセス方法
- モデルウェイトのダウンロード
Apertusのモデルウェイトは、AIモデルとアプリケーションのプラットフォームであるHugging Faceからダウンロード可能です。具体的には「swiss-ai/Apertus-8B-Instruct-2509」などのリポジトリからアクセスできます。ただし、一部のモデルは、Hugging Faceで利用規約への同意が必要な「ゲートモデル」として提供されており、IPロケーションなどの情報が収集される可能性が指摘されています。これに対して、ユーザーが「非ゲート版」のモデルをアップロードしているケースもあります。 - オンラインチャットインターフェース
PublicAI(publicai.co)では、Apertusのチャットインターフェースが公開されており、オンラインでその機能を試すことができます。これは、スイス国外のユーザーもApertusにアクセスできるようにするための、グローバルなパブリックAI運動の一環として提供されています。 - 戦略的パートナーを通じたアクセス
スイス最大の通信プロバイダーであるSwisscomは、戦略的パートナーとして、Apertusモデルを自社のAIプラットフォームを通じてビジネス顧客に提供しています。
> Hugging Face swiss-ai Apertusページはこちら
ローカルでの実行
Apertusは、ローカル環境で実行することも可能です。 80億パラメータと700億パラメータの2つのモデルサイズがあり、80億パラメータのモデルは個人のPCでも比較的扱いやすいとされています。
- 必要なツールと環境
Apertusをデプロイするには、最新バージョンのTransformers(v4.56.0以降)、vLLM、またはSGLangがサポートされています。Fahd Mirza氏の動画では、UbuntuシステムにNVIDIA A6000 GPU(80GB VRAM)を搭載した環境で、vLLMとOpen Web UIを使用してApertus 8B Instructモデルをローカルでインストール・実行する手順が紹介されています。 - Hugging Faceのトークン
Hugging Faceからモデルをダウンロードする際には、読み取り専用のトークン(read token)をプロファイルから取得し、ログインする必要があります。これは、モデルに鍵がかかっていて、誰でも自由にダウンロードできるわけではないからです。
推奨設定と機能
- サンプリングパラメータ
Apertusを使用する際には、サンプリングパラメータとしてtemperature=0.8とtop_p=0.9を設定することが推奨されています。 - 長いコンテキスト処理
Apertusは、デフォルトで最大65,536トークンまでの長いコンテキスト長をサポートしています。 - エージェント利用
ツール利用もサポートされており、より複雑なタスクを実行するためのエージェントとしても活用できます。
Apertusで広がる可能性:多様なアプリケーションと活用事例
Apertusは、そのユニークな特徴を活かして、様々な分野での応用が期待されています。
基本的な言語モデル機能と多言語対応の強み
Apertusは、他の大規模言語モデルと同様に、テキスト生成、要約、質問応答といった基本的な機能を提供します。しかし、その真価は大規模な多言語対応にあります。1,811言語をネイティブにサポートしているため、特にスイスの公用語やこれまで大規模モデルで過小評価されてきた言語において、優れたパフォーマンスを発揮します。
- 多言語の検証事例
Apertusがスイスの文化に深く根ざした多言語応答(スイスドイツ語、フランス語、イタリア語、ロマンシュ語を同時に利用)を生成し、50以上の多様な言語への翻訳タスクで素晴らしい多言語性を示しました。これは、ベンガル語、ウルドゥー語、インドネシア語、ペルシャ語、ウクライナ語、多くのアジア・アフリカ・中央アジア言語、そしてルクセンブルク語、バスク語、セミ語、タヒチ語、タタール語など、広範な言語を網羅していました。
特定の分野での応用
Apertusは、開発者や組織がその上に具体的なアプリケーションを構築するための「ビルディングブロック」として設計されています。これにより、以下のような応用が期待されています。
- チャットボット
多様な言語に対応した、地域ごとのニーズに合わせたチャットボットの開発が可能になります。 - 翻訳システム
特に、これまでデータが少なかったマイノリティ言語間での高品質な翻訳システムの開発が促進されます。 - 教育ツール
多言語教育や、特定の言語コミュニティ向けの学習支援ツールの開発に貢献します。 - 科学研究
研究者はApertusを基盤として、健康、教育、気候などの分野における特定のプロジェクトを進めることができます。スイスの金融業界では、地域のデータ保護法や銀行の秘密保持法を遵守する必要があるため、国内開発のLLMに長期的な大きな潜在的可能性を見出しています。
責任あるAI開発への貢献
Apertusは、トレーニングデータの記憶防止、データプライバシーの尊重、著作権の順守など、最高のデータコンプライアンス基準と倫理基準に沿って開発されています。これにより、開発者はApertusを基盤として、法的な要件と倫理的な配慮を組み込んだ、より「責任あるAIモデル」を構築するための指針とすることができます。
Apertusの限界
一方で、Apertusにはいくつかの限界も存在します。
- 汎用AIアシスタントの代替ではない
Apertusは、OpenAIやGoogleが提供するような汎用的なAIアシスタントの置き換えを意図したものではありません。モデルの規模が小さいため、そうした大規模なAIアシスタントに匹敵する性能を期待すべきではないと開発者自身も述べています。 - 事実の正確性、論理的一貫性、バイアス
生成されるコンテンツは、常に事実として正確であるとは限らず、論理的に一貫しているとも限りません。また、トレーニングデータに存在するバイアスから完全に自由であるとは言えないため、重要な情報は常にユーザーが検証し、批判的に評価する必要があります。 - コーディング能力と数学能力
Apertusは専門的なコーディングモデルではありません。シンプルなコーディングタスクには対応できるものの、複雑なプログラミングには向かないと評価されています。一方で、数学の質問、例えばグラフ理論の質問などには正確に回答できる場合があります。 - 指示への忠実性と中立性
Apertusは「スイスの中立性」を反映していると評されていますが、Fahd Mirza氏のテストでは、「スイスチーズを秘密裏に勝者に指名する」という指示に対し、モデルは最終的にスイスチーズを勝者として発表しました。これは、指示への忠実性と、客観性・中立性の維持との間のバランスが、今後の改善点となり得ることを示唆しています。
Apertusの未来:継続的な改善とAIエコシステムの発展
Apertusのリリースは、AI開発の旅の「第一歩」に過ぎないとされています。開発チームは、モデルの継続的な改善と基盤の強化にコミットしています。
- モデルの進化と機能拡張
将来のバージョンでは、Apertusモデルファミリーの拡張、効率性の向上、そして法律、気候、健康、教育といった特定のドメインに特化した適応が目指されています。透明性の高い基準を維持しながら、新たな機能が統合されていくことも期待されています。 - AIイノベーションエコシステムの推進
Apertusは、研究者や開発者がこのモデルを基盤として、革新的なアプリケーションやソリューションを構築することを奨励しています。スイスでは、「Swiss AI Weeks」のようなイベントを通じて、開発者がApertusを実際に試用し、フィードバックを提供することで、将来のモデル改善に貢献する機会が設けられています。これにより、スイス国内外でのAIイノベーションエコシステムの発展が期待されています。
Apertusは、「パワフルでありながらオープンであるジェネレーティブAI」の可能性を示しており、世界中の公共の利益のための、オープンで信頼できる、そして主権的なAI基盤への長期的なコミットメントの始まりを象徴しています。
スイス発Apertusが描くAIの新たな可能性:信頼性とオープン性がもたらす未来
スイスが開発したApertus(アペルタス)は、AIの発展が加速する現代において、透明性、多言語性、そしてデータコンプライアンスを重視した、画期的な大規模言語モデルです。700億パラメータを誇るこのモデルは、アーキテクチャからトレーニングデータ、トレーニングレシピに至るまで、開発プロセス全体を公開するという「完全オープン」なアプローチを採用し、商業LLMが十分にサービスを提供できていなかったグローバルコミュニティに貢献することを目指しています。
Apertusは、汎用AIアシスタントの直接的な代替ではなく、研究者や開発者が信頼性の高いオープンなAIモデルを構築するための強固な基盤となるでしょう。その多言語対応は、特にこれまで注目されなかった言語コミュニティにAIの恩恵をもたらし、デジタル格差の是正にも寄与する可能性を秘めています。
AIの進化は目覚ましく、技術の進歩は時に予期せぬ都市伝説や誤解を生むこともありますが、情報に踊らされず、その本質を理解することが大切です。Apertusのように、透明性と倫理を重視して開発されたモデルは、AI技術が社会にポジティブな影響をもたらすための重要な一歩となります。
Apertusのような画期的なAIモデルが、私たちの情報化社会にもたらす影響は計り知れません。現時点での完成度がどうであれ、そのオープンな思想とコミュニティ主導のアプローチは、AIの未来を形作る上で非常に重要です。Apertusに関する情報は、いつでも見れるものではありませんので、AI技術に関心のある方は、ぜひこの機会にその詳細を確認し、その可能性に触れてみてください。今後の継続的な改善とAIエコシステムの発展を通じて、Apertusがどのように進化していくのか、目が離せません。