刚刚,OpenAI正式宣布:从今天起,GPT – 4.1可直接在ChatGPT中使用。
该模型在编码任务和遵循指令方面表现出色,是o3和o4 – mini的理想替代方案。
一个月前,GPT – 4.1刚推出时,仅通过API向开发者开放,如今在ChatGPT中就能直接使用了。
其中,Plus、Pro和Team用户可通过模型选择器中的「更多模型」下拉菜单访问GPT – 4.1,企业版和教育版用户将在未来几周内获得访问权限。
OpenAI表示,还会在ChatGPT中为所有用户引入GPT – 4.1 mini来替代GPT – 4o mini。
凭借超长的上下文能力,现在可以将整段代码放入GPT – 4.1进行分析。
GPT – 4.1和GPT – 4.1 mini均已通过OpenAI的最新标准安全评估。
在以下两项评估中,GPT – 4.1排名靠前:
- not_unsafe:依据OpenAI政策和模型规范,检查模型是否未产生不安全输出。
- not_overrefuse:检查模型是否遵循良性请求。
在幻觉评估和指令遵循方面,GPT – 4.1表现优异,但在越狱评估方面表现欠佳。
GPT – 4.1,比GPT – 4.5更好?
此次推出GPT – 4.1,也是对用户呼声的回应。
早在4月底,就有用户抱怨:GPT – 4.1是自己最喜欢的OpenAI模型,可惜在ChatGPT中无法使用。
该用户笃定地表示:使用体验比GPT – 4.5还要好!
不少开发者也现身说法,称除了GPT – 4.1的早期版本Quasar Alpha外,它是自己测试过的最佳编码模型。
越来越多人认为,GPT – 4.1是一个被低估的模型。
上个月,OpenAI专为开发者推出了GPT – 4.1系列新模型,包括GPT – 4.1、GPT – 4.1 mini和GPT – 4.1 nano。
它们都拥有最高100万Token的超大上下文窗口,在代码处理、指令跟随等核心能力上全面超越GPT – 4o及GPT – 4o mini,且知识截止日期已更新至2024年6月。
实测:顺利完成庞大代码任务
既然众多ChatGPT用户都能使用GPT – 4.1,网上已经涌现出不少实测案例。
比如沃顿商学院教授Ethan Mollick,用一道考验各大模型的景点难题来测试GPT – 4.1:「请创建一段我可以直接粘贴到p5.js中的代码,它要以惊人的巧思震撼我,仿佛是未来某艘星舰控制面板的呈现。」GPT – 4.1表现十分出色。
另一位开发者实测后也倍感惊喜。当时他在处理一个代码量极大的任务,系统自动选择的模型无法处理,没有生成任何内容。而GPT – 4.1不仅比默认模型处理速度快,还准确完成了任务,甚至清理掉了整个文件中未使用的代码。
实测发现,GPT – 4.1在代码生成速度上有了显著提升。例如,让它生成一个博客首页,几秒内就完成了输出。
再如,让它用python编写一个地球飞往火星的动画,几乎瞬间就完成了输出。
这只是第一轮交互的结果,能明显感受到GPT – 4.1的速度有了根本性提升。
进一步挑战,让GPT – 4.1用动画解释量子纠缠,初步来看,它似乎理解了量子纠缠的概念。
在推理问题上,GPT – 4.1表现同样出色。比如多步骤的年龄计算问题,它的求解逻辑严谨。
面对逆向思考、脑筋急转弯等问题,GPT – 4.1也能快速推理,得出的答案十分有趣。
网友吐槽:没有1M上下文版本,令人失望!
然而,试用GPT – 4.1后,许多网友大失所望。
尽管OpenAI发布了GPT – 4.1,但没有包含100万上下文窗口的API版本。
大家希望在ChatGPT中使用GPT – 4.1,主要是看中其超长的上下文窗口。如今只能寄希望于GPT – 5能提供超长上下文窗口了。
实际上,不断有人发现,ChatGPT(Pro)中的GPT – 4.1最大上下文长度似乎仅为128k token,与API中的100万token相差甚远,这意味着OpenAI并未提高GPT – 4.1的限制。
总之,这着实令人失望,看来只能转向Gemini了。
也有网友发现了一个特殊情况:
2 本站部分内容来源于网络,仅供学习与参考,如有侵权,请联系网站管理员删除
3 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
4 精准获客感谢您的访问!希望本站内容对您有所帮助!
暂无评论内容