BLOOM:世界最大のオープン多言語言語モデルの紹介

BLOOM

BLOOMは、完全な透明性のもとで訓練された初の多言語大規模言語モデルで、46の自然言語と13のプログラミング言語でテキストを生成できます。

BLOOM:世界最大のオープン多言語言語モデルの紹介

BLOOMは、AI研究に大きな影響を与えてきた大規模言語モデル(LLM)の新たな一歩を表しています。この強力で汎用的なモデルは、ユーザーの指示に基づいて多様な言語タスクを遂行することが可能です。しかし、学界、非営利団体、そして小規模な企業の研究ラボは、必要なリソースと独占的な権利を持つ一部の産業ラボだけが完全にアクセスできるため、LLMの作成、研究、または使用が困難でした。

今日、私たちはこの現状を変えるために、完全な透明性のもとで訓練された初の多言語LLMであるBLOOMをリリースします。これは、単一の研究プロジェクトにこれまで以上に多くのAI研究者が関わった最大のコラボレーションの結果です。1760億のパラメータを持つBLOOMは、46の自然言語と13のプログラミング言語でテキストを生成することができます。スペイン語、フランス語、アラビア語など、ほとんどすべての言語において、BLOOMは100B以上のパラメータを持つ初の言語モデルとなります。

これは、70カ国以上、250以上の機関から1000人以上の研究者が関わり、フランスの研究機関CNRSとGENCIから推定300万ユーロの計算助成金を受けて、フランス南部のJean Zayスーパーコンピュータで117日間(3月11日~7月6日)にわたってBLOOMモデルを訓練した1年間の努力の結晶です。研究者は現在、BLOOMをダウンロード、実行、研究し、最近開発された大規模言語モデルのパフォーマンスと動作をその最深部の内部操作まで調査することができます。

より一般的には、モデルの責任あるAIライセンス(BigScienceプロジェクト自体で開発された)の条件に同意する個人または機関は、ローカルマシンまたはクラウドプロバイダー上でモデルを使用し、構築することができます。Hugging Faceエコシステムに組み込まれているため、transformersでインポートし、accelerateで実行するのと同じくらい簡単です。

このコラボレーションと継続的改善の精神に基づき、私たちは初めて、訓練の中間チェックポイントとオプティマイザの状態も公開します。8つのA100をプレイする必要はありません。大規模な使用のための推論APIを最終化しています。その間、クイックテスト、プロトタイピング、および小規模な使用のためには、HFハブで早期バージョンをすでにプレイすることができます。

これは始まりに過ぎません。BLOOMの能力は、ワークショップがモデルを実験し、いじくり回し続けることで、さらに向上し続けます。私たちは、以前の努力であるT0++と同じくらい指示可能にする作業を開始し、より多くの言語を追加し、同じレベルのパフォーマンスでモデルをより使いやすいバージョンに圧縮し、より複雑なアーキテクチャの出発点として使用する予定です。研究者と実務者が常に実行したかったすべての実験は、1000億以上のパラメータモデルの力で、今や可能です。BLOOMは、私たちが成長させようとしている生きているモデルファミリーの種であり、一度きりのモデルではありません。そして、私たちはそれを拡張するためのコミュニティの努力をサポートする準備ができています。

BLOOMの代替ツール

Convo

Convo

ConvoはAIがモデレートする質的ユーザーリサーチプラットフォームです。

TopicMojo

TopicMojo

TopicMojoは効果的なトピック研究ツールでユーザーを支援

ワードウェア

ワードウェア

ワードウェアは、AIスタックを構築・管理する超便利なAIツールキットだよ!

ヒューマン・オア・AIゲーム

ヒューマン・オア・AIゲーム

ヒューマン・オア・AIゲームは、画像が人間作かAI作かを判定できるよ!

The Full Stack

The Full Stack

The Full StackはAIパワード製品のためのコミュニティとコースを提供

techtrust.ai

techtrust.ai

techtrust.aiはAIテクノロジーを活用したサービスです

regex.ai

regex.ai

regex.aiはAIパワーの正規表現ソルバーで、テキスト入力と操作で正規表現を見つけます

Creators' AI

Creators' AI

Creators' AIはクリエイターと起業家向けのAIインサイトとツールを提供

GOODY

GOODY

GOODY-2は業界をリードする倫理原則に基づいたAIモデルです

Socially Sourced Startup Ideas

Socially Sourced Startup Ideas

「Socially Sourced Startup Ideas」は社会メディアから新規事業アイデアを発掘

screenpipe

screenpipe

screenpipeはデスクトップコンテキストとユーザー活動を取得するAIツール

Melon

Melon

Melonは学習をつなぎ、思考力を高めるAIツールです

Intuition Machines

Intuition Machines

Intuition MachinesはAI/MLを活用し、企業の未来に備える

Calypso

Calypso

CalypsoはAIを活用した株式投資のサポートツールです

GPTs Finder

GPTs Finder

GPTs Finderは最新のGPTsを毎時更新し、ユーザーに提供

BeanBook

BeanBook

BeanBookはAIを活用してコーヒー豆に関することを追跡・学習・質問できるアプリです

Prefind

Prefind

Prefind は GPT-4 & Claude-3 搭載の AI 検索エンジンで、効率的な検索体験を提供

Pl@ntNet

Pl@ntNet

Pl@ntNetは、写真から植物を識別し、植物の多様性に関する市民科学プロジェクトに参加できるアプリです。

Boba

Boba

Bobaはジェネレーティブアイデア生成のAIコパイロットで、様々な質問に答えるのに役立ちます

Wiseone

Wiseone

WiseoneはAIを活用し、検索と読書の生産性を高めるツール

Project Knowledge Exploration

Project Knowledge Exploration

「Project Knowledge Exploration は、自然言語入力でインタラクティブな検索体験を実現」

注目のAIツール

Keyword Ideen Tool

Keyword Ideen Tool

Keyword Ideen Toolは、SEOとPPCキャンペーンのための有益なキーワードアイデアを発見するAI駆動のプラットフォームです。

詳細を見る
BookNote.ΑΙ

BookNote.ΑΙ

BookNote.ΑΙは本のエッセンスを迅速に解明するAIアシスタントで、洞察を引き出し、議論を高めます

詳細を見る
Jina AI

Jina AI

Jina AIは、世界最高クラスのマルチモーダル・マルチリンガルの埋め込み技術を提供し、検索の関連性を最大化するためのニューラルリトリーバーです。

詳細を見る
TAVONNAI

TAVONNAI

TAVONNAIは、オープンソースの人工知能の無限の可能性を探求したいAI愛好家、クリエイター、イノベーターのための究極の遊び場です。

詳細を見る
Synthesio

Synthesio

Synthesioは、AIを活用した消費者インテリジェンスを提供し、ビジネス意思決定を迅速かつ効果的にサポートします。

詳細を見る
Consensus

Consensus

AI駆動の学術検索エンジンで、研究を迅速に行えます。

詳細を見る
BooksAI

BooksAI

AIによる書籍要約と推奨を提供する革新的なプラットフォーム。

詳細を見る
JFrog ML

JFrog ML

JFrog MLはAIアプリケーションを迅速に提供する統合MLOpsプラットフォーム

詳細を見る