开源智能代理浏览器,支持本地AI自动化和隐私保护
BrowserOS 详细介绍文档
项目概述
BrowserOS是一款开源的智能代理浏览器,支持本地运行AI代理。它是Perplexity Comet的隐私优先替代方案。该项目专注于提供隐私优先的浏览体验 - 使用您自己的API密钥或通过Ollama运行本地模型,您的数据保存在您的计算机上。
核心特性
🤖 本地AI代理
- AI代理在您的浏览器上运行,而不是在云端
- 使用browser-use和computer-use模型,将强大的AI代理直接集成到BrowserOS中。自动化任何繁琐的工作流程,全部在您的机器上运行
- 支持复杂工作流程自动化,从表单填写到深度研究
🔒 隐私保护
- 隐私优先 - 使用您自己的密钥或通过Ollama使用本地模型。您的浏览历史保存在您的计算机上
- 我们不是搜索或广告公司。您的数据通过内置的Ollama支持保持本地。我们也在构建基于LLM的广告拦截器
- 所有AI处理都在本地设备上进行,或通过您的个人API密钥进行
🏠 熟悉的界面
- 感觉像家一样 - 与Google Chrome相同的熟悉界面,兼容所有您的扩展
- 基于Chromium构建,确保与现有Chrome扩展和熟悉用户界面的兼容性
- 无需学习曲线,可以直接从Chrome导入数据
🚀 开源社区驱动
- 开源和社区驱动 - 准确了解底层发生的事情
- BrowserOS是AGPL-3.0许可证下的开源项目
- 完全透明,随时可以fork
主要功能
AI模型支持
BrowserOS支持OpenAI的GPT模型、Anthropic的Claude、Google的Gemini以及通过Ollama的本地模型。您甚至可以在分屏视图中并排运行多个模型。
支持的AI提供商:
- OpenAI GPT模型:GPT-3.5、GPT-4等
- Anthropic Claude:Claude-3系列模型
- Google Gemini:Gemini Pro等
- 本地模型:通过Ollama支持各种开源模型
自动化功能
让BrowserOS处理重复性任务。安排会议、填写表单、处理重复任务,只需几次点击。让BrowserOS来处理,您专注于真正重要的事情。
主要自动化能力:
- 表单自动填写:智能识别和填写各种表单
- 会议安排:自动化日程管理
- 数据提取:从网页中提取结构化数据
- 购物自动化:重复订购和价格比较
- 社交媒体管理:自动化社交媒体互动
生产力工具
内置原生高亮器和基于ChatGPT的书签管理器。对您的浏览历史、书签等进行语义搜索。询问从"我们的入职流程是什么?"到"谁在处理这个bug?"等任何问题。
核心生产力功能:
- 智能高亮器:原生网页高亮功能
- AI驱动的书签:智能组织和搜索书签
- 语义搜索:使用自然语言搜索浏览历史
- 多模型比较:同时使用多个AI模型进行对比
即将推出的功能
即将推出:MCP商店,一键安装流行的MCP并直接在浏览器栏中使用它们 即将推出:内置AI广告拦截器,适用于更多场景
技术架构
基础技术栈
- 核心:基于Chromium构建
- 开源许可:AGPL-3.0
- 平台支持:macOS、Windows(Linux即将支持)
- 扩展兼容:完全支持Chrome扩展
AI集成
- 本地处理:支持Ollama本地模型运行
- API集成:支持主流AI服务提供商
- MCP协议:支持Model Context Protocol用于AI-浏览器通信
- Browser-Use:集成browser-use库进行浏览器自动化
安装和使用
系统要求
BrowserOS可在macOS、Windows和Linux上运行。如果您的计算机可以运行Google Chrome,就可以运行BrowserOS。
安装步骤
- 下载安装包:从GitHub releases页面下载适合您操作系统的版本
- 导入Chrome数据(可选):可以导入现有的Chrome书签、浏览历史和保存的密码
- 配置AI提供商:
- 输入OpenAI、Anthropic等的API密钥,或
- 通过Ollama集成设置本地AI模型
- 开始自动化:开始使用AI代理自动化您的工作
基本使用
# 下载和安装BrowserOS
# 从 https://github.com/browseros-ai/BrowserOS/releases 下载
# 导入Chrome数据(可选)
# 在设置中选择导入Chrome数据
# 配置AI提供商
# 方式1:使用API密钥
# 在设置中输入OpenAI、Claude等API密钥
# 方式2:使用本地模型
# 安装Ollama:https://ollama.ai
# 在BrowserOS设置中配置本地模型地址
使用场景
开发者和技术爱好者
- 利用开源特性自定义AI代理或自动化脚本
- 支持代码解析和文档分析
- 快速理解技术内容或调试代码
研究人员和学生
- 使用网页摘要和翻译功能
- 快速提取文章要点
- 将外语内容翻译为中文,提高阅读效率
AI研究人员
- 利用多模型比较功能
- 测试不同模型在同一问题上的性能
- 适合学术研究或模型评估
企业用户
- 企业级隐私和安全保护
- 本地AI处理确保数据控制
- 可部署自有AI基础设施
竞争优势
vs Chrome
虽然我们感谢Google开源Chromium,但Chrome在10年中没有太大进展。没有AI功能,没有自动化,没有MCP支持。
vs Brave
我们喜欢Brave的开始,但他们在加密货币、搜索、VPN方面分散了太多精力。我们专注于AI驱动的浏览。
vs Arc/Dia
许多人喜欢Arc,但它是闭源的。当他们放弃用户时,没有求助途径。我们是100%开源的 - 随时可以fork!
vs Perplexity Comet
他们是搜索/广告公司。您的浏览历史成为他们的产品。我们保持一切本地化。
成本和定价
BrowserOS本身完全免费且开源。如果您选择使用OpenAI或Anthropic等云提供商,您只需为AI API使用付费。使用Ollama的本地模型完全免费。
费用结构
- BrowserOS软件:完全免费(开源)
- 云AI服务:按使用量付费(如选择使用)
- 本地模型:完全免费(仅消耗本地计算资源)
隐私和安全
数据保护
- 所有AI处理在本地设备上进行或通过个人API密钥
- 永不收集浏览数据
- 支持完全本地化的Ollama模型,数据永不离开您的机器
安全特性
- 企业级隐私和安全保护
- 本地AI处理确保完全数据控制
- 符合各种合规要求
社区和支持
参与方式
- GitHub:https://github.com/browseros-ai/BrowserOS
- Discord社区:实时支持和讨论
- 功能请求:匿名建议新功能
- 贡献代码:欢迎各技能水平的开发者
未来发展
近期计划
- Linux平台支持
- MCP商店上线
- AI广告拦截器完善
- 更多自动化模板
长期愿景
自Netscape 1994年以来,第一次感觉我们可以从头开始重新构想浏览器。我们看到Cursor如何为开发者提供了10倍的生产力提升,但浏览器感觉陷入了过去。
团队相信AI代理应该在本地安全地自动化工作,而不是将用户数据发送给搜索或广告公司。
总结
BrowserOS代表了浏览器技术的一次重大创新,将AI代理直接集成到浏览器中,同时保持用户隐私和数据安全。作为一个完全开源的项目,它为用户提供了一个真正可控、透明且功能强大的浏览体验。