【1】GPT-5值得称赞的能力:
1)编程能力强:在SWE-bench Verified取得74.9%,超过Opus 4.1的74.5%;Cogniton评测结果GPT-5全面超越Sonnet 4;LMArena的网页开发盲测分数大幅领先;Cursor的CEO也亲临直播现场称赞GPT-5的代码能力。
2)幻觉率低:GPT-5的幻觉率下降显著,在多个评测集下幻觉率仅为o3的五分之一;GPT-5现在更加诚实,对无法完成任务的欺骗率也大幅下降;一些早期测试者也提及了幻觉的大幅下降是重要特征。
3)长文本能力提升:GPT-5全系列支持400k上下文长度,较o3的200k提升翻倍,在AA-LCR中的表现非常出色。
4)思考效率更高:GPT-5可以用更少的思考时间获得更高的价值,比 o3 的输出token减少50-80%的情况下表现更好;GPT-5提供四种推理强度配置:高、中、低和最小。从Artificial Analysis的测试来看,在推理强度高的设定下平均每个任务的token生成量仍低于Gemini和Grok 4。
5)更长的思考时长:GPT-5 Pro能够进行更长时间的思考,使用规模化但高效的并行测试时计算。在对 1000多个真实案例评估中,外部专家在67.8%的时间里更喜欢 GPT‑5 Pro而不是GPT-5 thinking。GPT‑5 Pro的主要错误减少了 22%,并且在健康、科学、数学和编码方面表现出色。
6)推理成本降低:GPT-5输入/输出价格为$1.25/$10每百万tokens,较o3小幅降低,与Gemini 2.5 Pro齐平;Mini和Nano则分别是上述价格的1/5和1/25,用户更经济更快速的使用场景。
7)使用便捷性提升:GPT-5现在是一款带路由器的All in one模型系列,可以根据对话类型、复杂性、工具需求和用户的明确意图快速决定使用哪个模型。
8)在健康相关问题表现优异:健康是ChatGPT的主要应用场景之一,GPT-5在HealthBench上得分明显高于以往任何模型;用户反馈GPT-5在理解复杂癌症报告时速度更快、理解更细致,能像“思考伙伴”一样主动关联信息点,并建议向医生提出的关键问题。
【2】GPT-5的一些美中不足:
1)统一的多模态的能力:目前GPT-5仍只支持文本/图像输入和文本输出,未能实现理想中的文本/图片/视频/语音的全模态统一。
2)更多的工具调用:我们尚未看到更多外部工具的引入,但这项能力或许在上个月的ChatGPT Agent上已经提前更新了,其加入了视觉浏览器、PC终端访问等工具。
【3】对AI应用的结论:
1)或许一些领导看完发布会后认为GPT-5看起来比较平淡,不够劲爆,但我恰恰认为这是符合OpenAI这个消费科技公司的一贯主张。GPT-5的发布一方面补齐了OAI在代码、长文本上的短板、另一方面在幻觉率、思考效率、API成本这些应用层的关键堵点上显著发力,并用一个All in one的模型窗口,实现“用最简单的交互满足用户最终的需求”。而对模型能力的极致挖掘,或许我们可以多期待下后续的Claude和Gemini的版本更新。
2)尽管“模型即应用”的观点依然成立,但我们看到模型能力和应用落地的二阶导显然已经开始“劈叉”,即就算模型能力提升开始放缓,也并不会影响应用需求的加速爆发。本质原因还是因为最前沿的模型能力已经足够好了,多项能力已经迈过了PMF的拐点。无论是我们看到各类应用的ARR、模型的Token调用量、还是ChatGPT、Claude Code、可灵,包括我最近高频使用的录音会议总结工具Plaud,都是应用二阶导加速的体现。
模型的进步/降本还在延续,应用的春天已经到来。
财道社区风险提示
尊敬的证券投资者:
欢迎您来到和讯信息科技有限公司[911100006337057486] “财道”投资社区,我公司郑重提示您:我公司投顾服务在本平台以自营及合作产品形式上架展示,我们竭力提供可靠的服务,惟不保证绝对无误。
其中所有免费浏览内容由投顾服务人员或团队发布(包含但不仅限于和讯自有投顾人员),均仅代表其对市场所持观点,所载内容、数据仅供参考,参阅文字交流信息、资料及图表的人士,应考虑投资市场风险性。投资者依据本平台提供的信息、资料及图表进行金融、证券等投资项目所造成的盈亏与公司无关。不承诺投资者获取投资收益,也不与投资者约定分享投资收益或分担投资损失。本服务所提供的文字信息、资料及图表仅供参考,并不构成对任何股票的收购、购买、认购、抛售或持有的邀约或意图。
当您需付费订阅投顾服务时,需签署风险揭示书,需了解证券投资顾问业务是证券投资咨询业务的一种基本形式,指证券公司接受客户委托,按照约定,向客户提供涉及证券及证券相关产品的投资建议服务,辅助客户作出投资决策,并直接或者间接获取经济利益的经营活动。投资建议服务内容包括投资品种的选择、投资组合产品以及理财规划建议等。
在浏览平台产品服务的过程当中,请仔细阅读以下风险提示说明,以免带给您不必要的损失。股市有风险,入市需谨慎。
1、财道社区内服务人员包含但不仅限于和讯自有投顾人员,其免费发布的盘面消息解读、操作分析、理论知识,仅代表其建议,供您参考、学习,并不能作为您实盘操作的依据,也不构成任何股票、基金等金融产品的购买邀约,否则风险自负;
2、服务人员发布的政策、经济新闻都源自公开市场信息,决不存在欺骗、误导用户现象,希望用户实时监督,如有发现,及时与我们取得联系,我们将全力维护您的合法权益;
3、服务人员发布的原创性文章,请您尊重知识产权,未经书面授权转载,平台保留最终诉诸法律、追偿损失的权利;
4、为了保障您的权益,本平台不允许私下接受服务人员的服务(以电话、微信、QQ等形式相互联系),如违反以上规则让您蒙受损失,平台不承担任何责任。若您发现服务人员相关情形,可及时与我公司联系进行举报;
5、平台服务人员均已承诺,不提供违规荐股、代客理财或非平台咨询等非法业务,请您对自己的各类账号密码严格保密,勿交于他人管理,如出现类似行为,属于个人违规行为,与本平台无关,请您谨防受骗,我公司接受相关举报;
6、如遇不可抗力、不可预测风险,例如设备故障、网络故障等引起的不可抗拒原因导致服务问题及引起的损失,由您自行承担,平台不予负责;
7、平台举报电话:010-85697400(服务时间:工作日9:00—18:00)