GPT-4.5发布:高情商与高价的争议之战
时间:2025-03-04 01:00
小编:小世评选
出品|虎嗅科技组
作者|孙晓晨
编辑|苗正卿
2024年2月27日,当地时间,OpenAI的首席执行官山姆·奥特曼首次宣布GPT-4.5的正式发布,令整个科技界沸腾。奥特曼在社交X上对外表示:“好消息是,这个模型让我第一时间感觉自己是在与一个有思想的人对话。”随之而来的则是“坏消息”:该模型不仅性能惊人,其价格也极为昂贵。
在OpenAI举行的展示中,观众们亲眼目睹了GPT-4.5与用户的对话互动。在用户询问如何表达对朋友放鸽子这一行为的失望时,GPT-4.5并没有简单机械地回应,而是选择了一种更具情感智慧的方式,提示用户考虑如何冷静表达自己的情感。这样的表现提升了其“高情商”的形象。
GPT-4.5的成功与其在“情商”方面的提升息息相关。一方面,它通过强调对话的流畅性和自然性,使用户能够享受到更加真实的交流体验;另一方面,通过无监督学习方式,GPT-4.5能够有效识别并理解用户输入信息的情感倾向。这种能力让它在处理复杂的情绪表达和社交情境时,更显得得心应手。
在技术数据方面,GPT-4.5在SimpleQA测试中表现优异,准确率高达62.5%,幻觉率低至37.1%。这一数据相较于前代模型,如GPT-4o和OpenAI o1,可谓显著提升。这使得GPT-4.5不仅能够应对日常对话,也能在写作、编程等任务中提供更为有效的支持。
不过,尽管技术上取得了一定进展,GPT-4.5并不是一款全能的大模型。在数学推理和代码生成等需要深度思考的任务中,其表现却并不理想。奥特曼坦言:“这不是一个以推理为主的模型,也不会在基准测试中获得卓越成绩。它是一种不同寻常的智能,展现出过去没有体验过的魔力。”
对于GPT-4.5的定价策略,API使用者们则表现出了明显的分歧。每100万token的输入价格为75美元,输出则需要150美元,这一价格是上一代模型的30倍,甚至高于竞争对手Claude 3.7 Sonnet的25倍。不少网友认为,要为了更好的交流体验而支付如此高昂的费用实在不容易,纷纷对OpenAI的高价策略表示质疑。
企业用户对此情况有更为细致的观察。Box AI的CEO艾伦·莱维指出,通过与GPT-4o的比较,GPT-4.5在关键企业工作流程中的数据提取能力提升了19个百分点,成效显著。许多学术界的声音则指出该模型并不够出色,甚至有用户在评测中发现其编程能力与前代相当,或在某些领域上逊色于新兴竞争者,诸如马斯克旗下的xAI发布的“世界最聪明的模型”Grok 3。
值得注意的是,OpenAI将GPT-4.5界定为“一个非思维链模型”,暗示着在不久的将来,GPT-5将会面世。这一策略似乎是为了应对竞争对手,确保OpenAI在人工智能领域处于领先位置。尽管当前的GPT-4.5并未达到常被讨论的AGI(通用人工智能)水平,但其在情商表现上的优势依然让外界看到了未来发展的潜力。
随着DeepSeek R1、Grok 3等一系列新兴模型的崛起,整个人工智能行业正在经历一场前所未有的竞争风暴,而OpenAI的GPT-4.5是否能够在未来的市场角逐中保持一席之地仍是一个悬而未决的问题。2025年后,随着更高效的训练方法与技术的出现,GPT-5的表现是否能超越其前辈,也将成为众多企业及消费者所期待的焦点。
GPT-4.5的发布不仅仅是技术的进步,背后更反映出的是人工智能领域的格局变化。其“高情商”的特质展现了技术与人文结合的可能性,而超高的价格却提醒着我们,技术进步的同时也必须面对市场与应用上的挑战。在未来的发展中,如何在维持技术创新与合理用户体验间取得平衡,将是OpenAI以及所有人工智能企业需要共同面对的考验。