Grok 4正式发布!Grok 4有哪些亮点功能?

xAI推出旗舰模型Grok 4,月费近300美元,性能超越Google、OpenAI,并深度整合X 平台,掀起高端AI 市场新战场。

发生什么事?

伊隆·马斯克(Elon Musk) 旗下的人工智能公司xAI 于北京时间周四发布其最新的旗舰级AI 模型Grok 4,并同步推出名为「SuperGrok Heavy」的顶级订阅服务,月费高达300美元,此方案提供最强大的Grok 4 Heavy模型的使用权,但订阅费比Google AI Ultra的每月收费250美元,以及OpenAI ChatGPT Pro的每月收费200美元还要更贵。

五大AI模型顶级方案比一比

AI名称 方案名称 每月价格(美元) 目标客群 核心功能
Grok SuperGrok Heavy $300 进阶用户、追求极致AI能力者 使用Grok 4 Heavy模型、深度搜寻、强化推理
Gemini Ultra Plan $249.99 创意专业人士、开发者 使用Google最强大的AI模型、整合Google Workspace
ChatGPT ChatGPT Pro $200 重度用户、专业研究者 无限制使用顶尖模型(如GPT-4o)、深度研究、多媒体生成
Claude Claude Max Ultimate $200 重度商业用户、企业级应用 Pro方案20倍使用量、高峰时段优先权、优先体验新模型
Perplexity Perplexity Max $200 专业人士、研究员、重度用户 无限制使用多种顶尖AI模型、无限次使用Labs工具、优先体验新产品(如Comet浏览器)

据《Tech Church》报导,Grok 4 不仅能分析图像并回应问题,更深度整合至马斯克的社群网络X 平台。尽管外界对其寄予厚望,期待它能与OpenAI 预计于今夏稍晚推出的GPT-5 一较高下,但xAI 近期面临的内部动荡与旗下模型的言论争议,也为这次发布会蒙上一层阴影。

宣称性能超越群雄,多项基准测试夺冠

xAI 强调Grok 4 在学术问题上的表现已超越博士水准,马斯克更在直播中表示:「Grok 4 在所有学科上都优于博士,无一例外。」他坦言模型有时可能缺乏常识,也尚未发明新技术或发现新物理学,但他认为这只是时间问题。

为证明其强大性能,xAI 公布了多项基准测试成绩。在衡量AI 回答数千个人文、数学等众包问题能力的「Humanity's Last Exam」测试中,Grok 4 在无工具辅助下获得25.4% 的分数,超越了Google Gemini 2.5 Pro 的21.6% 及OpenAI o3 (high) 的21%。

而其「多代理版本」Grok 4 Heavy 在工具辅助下,分数更高达44.4%,大幅领先Gemini 2.5 Pro 的26.9%。此外,在另一项高难度的视觉模式识别测试ARC-AGI-2 中,Grok 4 以16.2% 的成绩创下新纪录,几乎是次世代商用模型Claude Opus 4 的两倍。


在Humanity's Last Exam测试中,Grok 4 在无工具辅助下获得25.4% 的分数,超越了Google Gemini 2.5 Pro 的21.6% 及OpenAI o3 (high) 的21%。图/ X

根据第三方单位Artificial Analysis测试评比目前市场上所有的先进AI模型,Grok 4 在智能指数(Artificial Analysis Intelligence Index)中以73 分的成绩位居榜首。紧随其后的是03-pro (72分)、Gemini 2.5 Pro (70分) 和03 (70分),这些模型的分数都非常接近,为第一领先集团。

至于Anthropic旗下的Reason-4 Opus (64分),以及Claude 3 Sonnet Thinking (61分),分别拿下第10名与第14名;而科技巨头中的末位者,则为Meta 的Llama 系列, Llama 4 Maverick (51分) 和Llama 4 Scout (43分) ,位于倒数之列。


Grok 4 在智能指数中以73 分的成绩位居榜首。紧随其后的是03-pro (72分)、Gemini 2.5 Pro (70分) 和03 (70分)。图/ Artificial Analysis

值得注意的是,在智能指数前10名中,有两个中国公司开发的模型,分别是DeepSeek R1 (68分)排名第6,以及第10名的Minimax M1 80k (63分)。

Grok 4 有哪些亮点功能?

根据目前公开资讯,位居目前市场中订阅费最高的Grok 4(SuperGrok Heavy方案)具备以下几项亮点功能:

1. 进阶推理能力 

Grok 4 在xAI 的Colossus 超级电脑上训练,强调「科学家等级」的逻辑推理与文字生成能力,目标是能处理更复杂的问题与推理任务。

2. 多模态功能 

Grok 4 支援文字、图像和语音输入,并具备图像生成能力。虽然目前图像识别功能仍在改进中,但其生成高品质图片的速度快(通常10-20 秒),适合创作者和需要图文整合的场景。

3. 专用编码模式(Grok 4 Code)

Grok 4 推出专为程序设计打造的Grok 4 Code 模型,支援高阶程式任务,可嵌入程式码编辑器(如Cursor),并提供自动化流程和代码调试功能,特别适合开发者和工程团队。这使其成为专业编码应用的强大工具。

4. 即时检索与X 平台整合(RAG 架构)

Grok 4 采用检索增强生成(RAG)技术,与X 平台深度整合,能即时撷取X 上的贴文、趋势和公开资讯,提供具时效性的回答。这对于媒体、评论产业和需要快速掌握社群动态的用户尤其有用。

5. 自然语音互动 

Grok 4 Voice 提供更自然、接近真人的语音互动,减少对话中断。此外,语音模式升级后更自然,支持低延迟对话,甚至可模拟唱歌或小声说话。

6. 网络文化理解 

Grok 4 对网络迷因、流行语、幽默等有更高的理解度,强调「网感」与文化流畅度,适合重度网络用户。

反犹言论延烧! xAI商业化之路挑战重重

尽管Grok 4 在技术指标上表现亮眼,xAI 的商业化之路却非一片坦途。就在新品发布的同一天,在X 公司任职约两年的执行长琳达·雅克里诺(Linda Yaccarino) 宣布离职,继任人选悬而未决。

数天前,Grok 的官方自动化X 帐号更因发表批评好莱坞「犹太高管」并赞扬希特勒的反犹言论而引发轩然大波,迫使xAI 暂时限制该帐号并删除争议贴文。此事件让外界质疑Grok 的可靠性与安全性,也让xAI 在向企业推广Grok 作为ChatGPT、Claude 和Gemini 的替代方案时,面临严峻的信任考验。

为拓展市场,xAI 正透过API 释出Grok 4,并计划与超大规模云端服务商合作,但能否说服企业客户接纳这个性能强大却又充满争议的AI 模型,仍有待市场观察。

本文链接地址:https://www.wwsww.cn/rgzn/33186.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。