今日跨境指数:全球最强大模型易主?Anthropic称其Claude 3已全面超越GPT-4

作者:Anthropic、The Verge、Tech Crunch 责任编辑:Peak 发布时间:2024-03-05

美国时间3月4日,由 OpenAI 几位前员工创立的人工智能公司Anthropic宣布推出Claude 3 模型系列,并表示该系列AI模型性能已超越Google和OpenAI的Gemini 1.0 Ultra与GPT-4,全球最强大AI模型似乎一夜易主。

技术的进步始终是惊人的。美国时间3月4日,由 OpenAI 几位前员工创立的人工智能公司Anthropic宣布推出Claude 3 模型系列,并表示该系列AI模型的性能已超越Google和OpenAI的Gemini 1.0 Ultra与GPT-4,全球最强大AI模型似乎一夜易主。

据Anthropic介绍,Claude 3模型系列主要包括三大最先进的型号:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。

其中,Claude 3 Opus是Anthropic最智能的模型,可以以高度流畅性和类似人类的理解能力完成工作。应用包括支持跨 API 和数据库规划和执行复杂的操作、交互式编码,辅助研究回顾和假设生成、药物发现,进行图表、财务和市场趋势的高级分析、预测。

Claude 3 Sonnet与同类产品相比,具有更高性价比的功能,专为大规模AI部署中的高耐用性而设计。在RAG 或对大量知识搜索和检索的数据处理层面,在产品推荐、预测、定向营销的销售层面,在代码生成、质量控制、从图像中解析文本等节省时间的任务层面有着较强的企业员工减负助力。

Claude 3 Haiku是同系列中最快、最紧凑的模型,具有近乎即时的响应能力,可快速回答用户简单的查询与请求,为用户提供类似与人类交互的无缝人工智能体验。在实时互动、快速准确翻译的客户互动上,在捕捉危险行为或客户请求的内容审核上,在优化物流、库存管理、从非结构化数据中提取知识上能够提供高效的用户、客户体验。

(来源:Anthropic)

据了解,与GPT-4和Gemini 1.0 Ultra相比,Claude 3模型系列性能先进性与优势主要表现为:

树立行业智能新基准。所有Claude 3模型都显示出在分析和预测、细致内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的增强能力。其中,Opus 是Anthropic目前最智能的模型,在人工智能系统的大多数常见评估基准上优于同行,包括本科水平专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等,它在复杂任务上表现出接近人类水平的理解力和流畅性,引领通用智能的前沿。

(来源:Anthropic)

提供近乎即时的结果。Claude 3 模型可以支持实时客户聊天、自动完成和数据提取任务,其中响应可实现立即且实时。例如,Haiku 是Anthropic号称智能类别市场上速度最快且最具成本效益的型号,可以在不到三秒的时间内阅读包含图表和图形的信息和数据密集的研究论文(约 10k 代币),发布后,Anthropic还计划进一步提高性能;Sonnet、Opus的智能处理速度与水平则较Haiku更高一级。

处理视觉格式的强大能力。Claude 3 型号可以处理各种视觉格式,包括照片、图表、图形、PDF、流程图或演示幻灯片等,支持多模态语言查询访问。

(来源:Anthropic)

更低频的拒绝回答。与前几代模型相比,Opus、Sonnet 和 Haiku 拒绝回答接近系统护栏的提示的可能性明显降低,Claude 3 模型对请求表现出更细致的理解,能够识别真正的伤害,并且拒绝回答无害提示的频率要少得多,可以更好地满足用户提问需求。

准确性更高。Anthropic在Claude 3 模型使用了大量复杂的事实问题来训练改善行业模型已知不足,并将答案分为正确答案、错误答案(或幻觉)和承认不确定性。当模型无法提供答案是会坦白说明而非提供不正确的信息。另与 Claude 2.1 相比,Opus 在具有挑战性的开放式问题上的准确性提高了一倍,同时也减少了错误答案的水平。

(来源:Anthropic)

长上下文强理解力和近乎完美的信息回忆能力。Claude 3 系列型号在最初发布时提供200K上下文窗口,三种模型都能够接受超过100万个指令的输入,长上下文的输入与理解能力赋予了该模型系列更强大的信息处理能力。比如,Claude 3 Opus实现了99%的信息回忆准确率,可与用户开展更为精确、连续的对话等。

Anthropic 表示,截至 2023 年 8 月,Anthropic 主要使用非公开内部和第三方数据集以及公开数据对 Claude 3 模型进行训练,并主要使用亚马逊AWS和谷歌云的硬件开展训练。亚马逊与谷歌两家公司均投资了 Anthropic,其中亚马逊向该公司已投资 40 亿美元,且就在Claude 3 模型发布当天,亚马逊宣布允许用户通过Amazon Bedrock访问Claude 3 模型。

当然,Anthropic 的Claude 3 模型也依旧存在不足。比如,出于对伦理与法律的精益,Claude 3 模型系列还无法识别人像;处于技术与业务限制,Claude 3 模型系列能够提供图像分析却还无法生成图像,尤其是艺术图。截止目前,Opus 和 Sonnet 已经可以在 claude.ai 中使用, Claude API 也已在159 个国家/地区广泛使用。

(来源:Anthropic)

【原创申明】为了更好保护支持原创内容和对忠实读者负责,本网站跨境阿米SHOW(网站地址:www.amishow.com)及公众号跨境阿米SHOW(微信号:amishow321)刊载的包括文字、图片、音频、视频等所有内容,除签署正式付费转载协议伙伴外,禁止任何形式的复制、转载、修改或者以其他方式使用本网站或本公众号的内容。本网站或本公众号部分引用资料只代表原作者意见,不代表本网站www.amishow.com或者本公众号『跨境阿米SHOW』任何立场,如发现本站文字存在版权疑问,请联系我们「微信号:amishow01」「邮箱copyright@amishow.com」处理。

发表评论

请先登录后参与评论

已有

{{ item.user_info.display_name }}

{{ item.comment_content }}
{{ item.show_time }}

推荐视频