オープンソースのインテリジェントエージェントブラウザ。ローカルAI自動化とプライバシー保護をサポート。
BrowserOS 詳細紹介ドキュメント
プロジェクト概要
BrowserOSは、AIエージェントのローカル実行をサポートするオープンソースのスマートエージェントブラウザです。Perplexity Cometのプライバシー優先の代替として、ご自身のAPIキーを使用するか、Ollamaを介してローカルモデルを実行することで、データがご自身のコンピューターに保存される、プライバシーを最優先したブラウジング体験の提供に注力しています。
主要機能
🤖 ローカルAIエージェント
- AIエージェントはクラウドではなく、ブラウザ上で動作します
- browser-useおよびcomputer-useモデルを使用し、強力なAIエージェントをBrowserOSに直接統合します。あらゆる煩雑なワークフローを、すべてご自身のマシン上で自動化できます。
- フォーム入力から詳細な調査まで、複雑なワークフローの自動化をサポートします。
🔒 プライバシー保護
- プライバシーを最優先 - ご自身のキーを使用するか、Ollamaを介してローカルモデルを使用します。閲覧履歴はご自身のコンピューターに保存されます。
- 当社は検索会社でも広告会社でもありません。データは内蔵のOllamaサポートによりローカルに保持されます。LLMベースの広告ブロッカーも開発中です。
- すべてのAI処理はローカルデバイス上で行われるか、ご自身の個人APIキーを介して行われます。
🏠 馴染みやすいインターフェース
- まるで自宅にいるかのように - Google Chromeと同じ馴染みやすいインターフェースで、すべての拡張機能と互換性があります。
- Chromiumをベースに構築されており、既存のChrome拡張機能や馴染みやすいユーザーインターフェースとの互換性を保証します。
- 学習曲線は不要で、Chromeから直接データをインポートできます。
🚀 オープンソース&コミュニティ主導
- オープンソースでコミュニティ主導 - 内部で何が起こっているかを正確に把握できます。
- BrowserOSはAGPL-3.0ライセンスの下でオープンソースプロジェクトです。
- 完全に透明で、いつでもフォーク可能です。
主な機能
AIモデルサポート
BrowserOSは、OpenAIのGPTモデル、AnthropicのClaude、GoogleのGemini、およびOllamaを介したローカルモデルをサポートしています。分割画面ビューで複数のモデルを並行して実行することも可能です。
サポートされるAIプロバイダー:
- OpenAI GPTモデル:GPT-3.5、GPT-4など
- Anthropic Claude:Claude-3シリーズモデル
- Google Gemini:Gemini Proなど
- ローカルモデル:Ollamaを介して様々なオープンソースモデルをサポート
自動化機能
BrowserOSに繰り返しタスクを処理させましょう。会議のスケジュール設定、フォーム入力、繰り返し作業を数クリックで実行できます。BrowserOSに任せて、本当に重要なことに集中してください。
主な自動化機能:
- フォーム自動入力:様々なフォームをインテリジェントに認識し、入力
- 会議スケジュール設定:日程管理の自動化
- データ抽出:ウェブページから構造化データを抽出
- ショッピング自動化:繰り返し注文と価格比較
- ソーシャルメディア管理:ソーシャルメディアインタラクションの自動化
生産性向上ツール
ネイティブのハイライターとChatGPTベースのブックマークマネージャーを内蔵。閲覧履歴、ブックマークなどをセマンティック検索できます。「当社のオンボーディングプロセスは何ですか?」から「このバグは誰が担当していますか?」まで、あらゆる質問を投げかけることができます。
主要な生産性機能:
- スマートハイライター:ネイティブのウェブページハイライト機能
- AI駆動のブックマーク:ブックマークのインテリジェントな整理と検索
- セマンティック検索:自然言語を使用して閲覧履歴を検索
- 複数モデル比較:複数のAIモデルを同時に使用して比較
今後の機能
近日公開:MCPストア、人気のMCPをワンクリックでインストールし、ブラウザバーで直接使用可能に 近日公開:より多くのシナリオに対応する内蔵AI広告ブロッカー
技術アーキテクチャ
基本技術スタック
- コア:Chromiumベースで構築
- オープンソースライセンス:AGPL-3.0
- プラットフォームサポート:macOS、Windows(Linuxは近日サポート予定)
- 拡張機能互換性:Chrome拡張機能を完全にサポート
AI統合
- ローカル処理:Ollamaローカルモデルの実行をサポート
- API統合:主要なAIサービスプロバイダーをサポート
- MCPプロトコル:AI-ブラウザ間通信のためのModel Context Protocolをサポート
- Browser-Use:ブラウザ自動化のためのbrowser-useライブラリを統合
インストールと使用方法
システム要件
BrowserOSはmacOS、Windows、Linuxで動作します。お使いのコンピューターがGoogle Chromeを実行できる場合、BrowserOSも実行できます。
インストール手順
- インストールパッケージのダウンロード:GitHubのリリースぺージから、お使いのOSに適したバージョンをダウンロードします。
- Chromeデータのインポート(オプション):既存のChromeブックマーク、閲覧履歴、保存されたパスワードをインポートできます。
- AIプロバイダーの設定:
- OpenAI、AnthropicなどのAPIキーを入力するか、
- Ollama統合を介してローカルAIモデルを設定します。
- 自動化の開始:AIエージェントを使用して作業の自動化を開始します。
基本的な使用方法
# BrowserOSをダウンロードしてインストール
# https://github.com/browseros-ai/BrowserOS/releases からダウンロード
# Chromeデータをインポート(オプション)
# 設定でChromeデータのインポートを選択
# AIプロバイダーを設定
# 方法1:APIキーを使用
# 設定でOpenAI、ClaudeなどのAPIキーを入力
# 方法2:ローカルモデルを使用
# Ollamaをインストール:https://ollama.ai
# BrowserOSの設定でローカルモデルのアドレスを設定
使用シナリオ
開発者および技術愛好家
- オープンソースの特性を活用してAIエージェントや自動化スクリプトをカスタマイズ
- コード解析とドキュメント分析をサポート
- 技術コンテンツの迅速な理解やコードのデバッグ
研究者および学生
- ウェブページの要約と翻訳機能を使用
- 記事の要点を迅速に抽出
- 外国語コンテンツを日本語に翻訳し、読書効率を向上
AI研究者
- 複数モデル比較機能を活用
- 同じ問題に対する異なるモデルのパフォーマンスをテスト
- 学術研究やモデル評価に適しています
企業ユーザー
- エンタープライズレベルのプライバシーとセキュリティ保護
- ローカルAI処理によるデータ制御の確保
- 独自のAIインフラストラクチャのデプロイが可能
競合優位性
Chromeとの比較
GoogleがChromiumをオープンソース化したことに感謝していますが、Chromeは10年間で大きな進展がありませんでした。AI機能も、自動化も、MCPサポートもありません。
Braveとの比較
Braveの始まりは好ましく思いますが、彼らは暗号通貨、検索、VPNにあまりにも多くの労力を分散させました。私たちはAI駆動のブラウジングに注力しています。
Arc/Diaとの比較
多くの人がArcを好んでいますが、それはクローズドソースです。彼らがユーザーを見捨てた場合、助けを求める術はありません。私たちは100%オープンソースです - いつでもフォーク可能です!
Perplexity Cometとの比較
彼らは検索/広告会社です。あなたの閲覧履歴は彼らの製品になります。私たちはすべてをローカルに保ちます。
コストと価格設定
BrowserOS自体は完全に無料でオープンソースです。OpenAIやAnthropicなどのクラウドプロバイダーを使用することを選択した場合、AI APIの使用料のみを支払う必要があります。Ollamaのローカルモデルを使用する場合は完全に無料です。
費用構造
- BrowserOSソフトウェア:完全無料(オープンソース)
- クラウドAIサービス:使用量に応じて課金(使用を選択した場合)
- ローカルモデル:完全無料(ローカル計算リソースのみを消費)
プライバシーとセキュリティ
データ保護
- すべてのAI処理はローカルデバイス上で行われるか、個人APIキーを介して行われます。
- 閲覧データを収集することはありません。
- 完全にローカルなOllamaモデルをサポートしており、データがご自身のマシンから離れることはありません。
セキュリティ機能
- エンタープライズレベルのプライバシーとセキュリティ保護
- ローカルAI処理により完全なデータ制御を保証
- 様々なコンプライアンス要件に準拠
コミュニティとサポート
参加方法
- GitHub:https://github.com/browseros-ai/BrowserOS
- Discordコミュニティ:リアルタイムサポートと議論
- 機能リクエスト:匿名で新機能を提案
- コード貢献:あらゆるスキルレベルの開発者を歓迎
今後の展望
短期計画
- Linuxプラットフォームのサポート
- MCPストアの公開
- AI広告ブロッカーの改善
- より多くの自動化テンプレート
長期ビジョン
1994年のNetscape以来、初めてブラウザをゼロから再考できると感じています。Cursorが開発者に10倍の生産性向上をもたらしたのを見てきましたが、ブラウザは過去に囚われているように感じられます。
チームは、AIエージェントがユーザーデータを検索会社や広告会社に送信するのではなく、ローカルで安全に作業を自動化すべきだと考えています。
まとめ
BrowserOSは、AIエージェントをブラウザに直接統合し、ユーザーのプライバシーとデータセキュリティを維持しながら、ブラウザ技術における大きな革新を象徴しています。完全にオープンソースのプロジェクトとして、ユーザーに真に制御可能で透明性があり、強力なブラウジング体験を提供します。