xAI推出旗舰模型Grok 4,月费近300美元,性能超越Google、OpenAI,并深度整合X 平台,掀起高端AI 市场新战场。
发生什么事?
伊隆·马斯克(Elon Musk) 旗下的人工智能公司xAI 于北京时间周四发布其最新的旗舰级AI 模型Grok 4,并同步推出名为「SuperGrok Heavy」的顶级订阅服务,月费高达300美元,此方案提供最强大的Grok 4 Heavy模型的使用权,但订阅费比Google AI Ultra的每月收费250美元,以及OpenAI ChatGPT Pro的每月收费200美元还要更贵。
五大AI模型顶级方案比一比
AI名称 | 方案名称 | 每月价格(美元) | 目标客群 | 核心功能 |
---|---|---|---|---|
Grok | SuperGrok Heavy | $300 | 进阶用户、追求极致AI能力者 | 使用Grok 4 Heavy模型、深度搜寻、强化推理 |
Gemini | Ultra Plan | $249.99 | 创意专业人士、开发者 | 使用Google最强大的AI模型、整合Google Workspace |
ChatGPT | ChatGPT Pro | $200 | 重度用户、专业研究者 | 无限制使用顶尖模型(如GPT-4o)、深度研究、多媒体生成 |
Claude | Claude Max Ultimate | $200 | 重度商业用户、企业级应用 | Pro方案20倍使用量、高峰时段优先权、优先体验新模型 |
Perplexity | Perplexity Max | $200 | 专业人士、研究员、重度用户 | 无限制使用多种顶尖AI模型、无限次使用Labs工具、优先体验新产品(如Comet浏览器) |
据《Tech Church》报导,Grok 4 不仅能分析图像并回应问题,更深度整合至马斯克的社群网络X 平台。尽管外界对其寄予厚望,期待它能与OpenAI 预计于今夏稍晚推出的GPT-5 一较高下,但xAI 近期面临的内部动荡与旗下模型的言论争议,也为这次发布会蒙上一层阴影。
宣称性能超越群雄,多项基准测试夺冠
xAI 强调Grok 4 在学术问题上的表现已超越博士水准,马斯克更在直播中表示:「Grok 4 在所有学科上都优于博士,无一例外。」他坦言模型有时可能缺乏常识,也尚未发明新技术或发现新物理学,但他认为这只是时间问题。
为证明其强大性能,xAI 公布了多项基准测试成绩。在衡量AI 回答数千个人文、数学等众包问题能力的「Humanity's Last Exam」测试中,Grok 4 在无工具辅助下获得25.4% 的分数,超越了Google Gemini 2.5 Pro 的21.6% 及OpenAI o3 (high) 的21%。
而其「多代理版本」Grok 4 Heavy 在工具辅助下,分数更高达44.4%,大幅领先Gemini 2.5 Pro 的26.9%。此外,在另一项高难度的视觉模式识别测试ARC-AGI-2 中,Grok 4 以16.2% 的成绩创下新纪录,几乎是次世代商用模型Claude Opus 4 的两倍。
在Humanity's Last Exam测试中,Grok 4 在无工具辅助下获得25.4% 的分数,超越了Google Gemini 2.5 Pro 的21.6% 及OpenAI o3 (high) 的21%。图/ X
根据第三方单位Artificial Analysis测试评比目前市场上所有的先进AI模型,Grok 4 在智能指数(Artificial Analysis Intelligence Index)中以73 分的成绩位居榜首。紧随其后的是03-pro (72分)、Gemini 2.5 Pro (70分) 和03 (70分),这些模型的分数都非常接近,为第一领先集团。
至于Anthropic旗下的Reason-4 Opus (64分),以及Claude 3 Sonnet Thinking (61分),分别拿下第10名与第14名;而科技巨头中的末位者,则为Meta 的Llama 系列, Llama 4 Maverick (51分) 和Llama 4 Scout (43分) ,位于倒数之列。
Grok 4 在智能指数中以73 分的成绩位居榜首。紧随其后的是03-pro (72分)、Gemini 2.5 Pro (70分) 和03 (70分)。图/ Artificial Analysis
值得注意的是,在智能指数前10名中,有两个中国公司开发的模型,分别是DeepSeek R1 (68分)排名第6,以及第10名的Minimax M1 80k (63分)。
Grok 4 有哪些亮点功能?
根据目前公开资讯,位居目前市场中订阅费最高的Grok 4(SuperGrok Heavy方案)具备以下几项亮点功能:
1. 进阶推理能力
Grok 4 在xAI 的Colossus 超级电脑上训练,强调「科学家等级」的逻辑推理与文字生成能力,目标是能处理更复杂的问题与推理任务。
2. 多模态功能
Grok 4 支援文字、图像和语音输入,并具备图像生成能力。虽然目前图像识别功能仍在改进中,但其生成高品质图片的速度快(通常10-20 秒),适合创作者和需要图文整合的场景。
3. 专用编码模式(Grok 4 Code)
Grok 4 推出专为程序设计打造的Grok 4 Code 模型,支援高阶程式任务,可嵌入程式码编辑器(如Cursor),并提供自动化流程和代码调试功能,特别适合开发者和工程团队。这使其成为专业编码应用的强大工具。
4. 即时检索与X 平台整合(RAG 架构)
Grok 4 采用检索增强生成(RAG)技术,与X 平台深度整合,能即时撷取X 上的贴文、趋势和公开资讯,提供具时效性的回答。这对于媒体、评论产业和需要快速掌握社群动态的用户尤其有用。
5. 自然语音互动
Grok 4 Voice 提供更自然、接近真人的语音互动,减少对话中断。此外,语音模式升级后更自然,支持低延迟对话,甚至可模拟唱歌或小声说话。
6. 网络文化理解
Grok 4 对网络迷因、流行语、幽默等有更高的理解度,强调「网感」与文化流畅度,适合重度网络用户。
反犹言论延烧! xAI商业化之路挑战重重
尽管Grok 4 在技术指标上表现亮眼,xAI 的商业化之路却非一片坦途。就在新品发布的同一天,在X 公司任职约两年的执行长琳达·雅克里诺(Linda Yaccarino) 宣布离职,继任人选悬而未决。
数天前,Grok 的官方自动化X 帐号更因发表批评好莱坞「犹太高管」并赞扬希特勒的反犹言论而引发轩然大波,迫使xAI 暂时限制该帐号并删除争议贴文。此事件让外界质疑Grok 的可靠性与安全性,也让xAI 在向企业推广Grok 作为ChatGPT、Claude 和Gemini 的替代方案时,面临严峻的信任考验。
为拓展市场,xAI 正透过API 释出Grok 4,并计划与超大规模云端服务商合作,但能否说服企业客户接纳这个性能强大却又充满争议的AI 模型,仍有待市场观察。
本文链接地址:https://www.wwsww.cn/rgzn/33186.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。