然而,欧盟境内注册或主要营业地的用户及企业被禁止使用或分发这些模型,受AI与数据隐私法规的合规要求影响。
4.Meta宣称对Llama 4全系模型进行了调优,使其更少拒绝回答争议性问题。
Meta在周六发布了其Llama系列的新一代AI模型集合——Llama 4(选在周末发布这一动作本身就很耐人寻味)。此次共推出四款新模型:Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。据Meta透露,这些模型均通过海量未标注的文本、图像及视频数据训练,从而具备广泛的视觉理解能力。
有消息称,中国AI实验室深度求索(DeepSeek)开源模型的成功——其性能达到甚至超越Meta前代旗舰Llama模型——直接推动了Llama研发进程的加速。据传Meta紧急组建了战情室,试图破译深度求索如何降低R1、V3等模型运行和部署成本的技术路径。
Llama 4的授权条款可能引发部分开发者争议。根据许可协议,欧盟境内注册或主要营业地的用户及企业被禁止使用或分发这些模型,这显然是受该地区AI与数据隐私法规的合规要求影响(Meta此前曾公开批评这些法规限制过严)。此外延续既往政策,月活用户超7亿的企业须向Meta申请特殊授权,而Meta拥有绝对审批权。
据披露,Llama 4是Meta首个采用混合专家(MoE)架构的模型系列,该设计能显著提升训练及查询应答的算力效率。MoE架构将数据处理任务分解为子任务,交由小型专业化专家模型处理。以Maverick为例,其总参数量达4000亿,但通过128个专家模型仅激活170亿参数(参数规模大致对应模型的问题解决能力);Scout则激活170亿参数,包含16个专家模型,总参数量1090亿。
值得注意的是,Llama 4全系均未采用类似OpenAI o1和o3-mini的专用推理架构。推理模型会对答案进行事实核查,响应更可靠,但应答速度慢于传统非推理模型九游会。
耐人寻味的是,Meta宣称对Llama 4全系模型进行了调优,使其更少拒绝回答争议性问题。据称相较于前代产品,Llama 4现在会回应那些涉及社会议题的争议性提问。Meta表示新模型在拒绝回答的提示词选择上也显著更平衡。
[Llama 4]能提供客观有益的回答而不带预设立场,Meta发言人向TechCrunch表示,我们持续提升模型的响应能力,使其能回答更多问题,兼容多元观点[...]且不偏袒特定立场。这些调整正值白宫盟友团体指控AI聊天机器人立场过于觉醒之际。
包括亿万富翁埃隆·马斯克和加密货币与AI沙皇大卫·萨克斯在内的特朗普核心幕僚,多次公开指控主流AI聊天机器人审查保守派观点。萨克斯长期指称OpenAI的ChatGPT被编程成觉醒派,在议题上存在不实陈述。实际上,AI偏见是行业公认的技术难题——马斯克自创的xAI公司至今也未能打造出完全中立的聊天机器人。
这并不妨碍OpenAI等公司持续调整模型策略,使其能应答更多(尤其是敏感争议话题类的)过往被规避的问题。