马斯克旗下的人工智能新创公司xAI 持续为Grok 注入新功能。马斯克亲自在社群平台X 上介绍Grok 的最新功能,透过相机进行即时影像解析,只要将镜头对准任何物体,询问Grok「这是什么?」,Grok 就能立即分析画面内容,给出详细说明,甚至进一步进行推理与延伸解读。
Grok 最初以「敢讲真话、带点幽默感」作为定位,被视为马斯克对抗主流AI 产品的重要布局,与其他大型语言模型不同,Grok强调即时性与与X 平台和Chatbot 聊天机器人的深度整合,能即时参考平台上的公开资讯与热门讨论。过去媒体曾形容Grok 是一款更贴近社群脉动、回应风格更直接的AI 助手。

Grok 推出拍照立即解析功能
Grok 的拍照立即解析功能,让Grok 正式跨入多模态AI 的应用场景。根据马斯克的介绍,用户可以扫描笔记、地点、绘画、文件,甚至是外语文字,Grok 都能进行辨识、分析与翻译。不论是在学习、工作、旅行、烹饪,或只是出于好奇想了解眼前的事物,这项功能都能即时派上用场。

实测Grok 拍照与分析功能
实际测试中,笔者使用手机拍摄一个日常水壶,询问Grok「这是什么?」。令人意外的是,大约五秒时间,Grok 不仅成功判断这是一个可重复使用的塑胶饮用水瓶,还进一步推测其品牌来源。即使瓶身上并未标示品牌Logo,Grok 仍分析指出该水壶为日本百元商店连锁品牌大创(Daiso)所贩售的商品,容量约在400 至500 毫升之间。
Grok 聊天机器人跟你分享「它」的延伸回馈
更有趣的是,Grok 并未止步于物品辨识,而是对瓶身设计与文字进行延伸解读。瓶身上印有「earthiness」字样,并搭配一句英文标语Life is only once. Live a wonderful life.(人生只有一次,活出精彩人生)。 Grok 指出这类略显直白、甚至带点生硬的英文格言,在日本生活用品设计中相当常见,常被用来营造正向、励志的生活氛围。 Grok 甚至尝试将这段文字与「日式生活美学」连结,做出带有推理成分的评论。
在产品使用细节描述上,Grok 也提到水壶采用旋盖式设计,结合翻盖式吸嘴,顶部附有提把或挂环,方便使用者外出携带或挂在背包上。这类结构常见于通勤、运动或轻度户外活动的水壶产品,符合百元商店强调实用与性价比的定位。
从这次实测可以看出Grok 的影像理解能力已不仅停留在「看图说故事」,而是尝试结合物件特征、文化背景与语意推理,提供更完整的解释,这也呼应马斯克一贯的主张:AI 不该只是冷冰冰的工具,而应该能像人类一样观察、思考,甚至对细节产生评论。
随着Grok 持续进化,外界也在观察,Grok 结合社群即时资讯与多模态能力的聊天机器人,是否能在竞争激烈的人工智慧赛道中,走出一条属于自己的路线。对一般用户来说,拿起手机、对准世界,直接用语音询问「我看到的是什么?」或许正是AI 真正融入日常生活的开始。
本文链接地址:https://www.wwsww.cn/rgzn/35973.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。



