From context_handle to type confusion 不安全 1 week ago In this blog post, I will share a common type-confusion vulnerability scenario that exists in
无限博弈!斗象发布针对AI的攻击测试套件 斗象智能安全 1 week ago 随着大模型和Agent快速落地,企业AI应用从简单问答扩展到工具调用、知识库检索、自动化执行,安全风险也随之升级。 过去主要盯着模型输出是否违规、泄露🔍,如今风险更多藏在Agent行为过程里:越权取数据🚫、调错工具❌、记忆污染🧠、绕过审批⏩,甚至触发业务副作用💥。传统基于模型输出的安全测试,已经兜不住这些新风险了😰 为此,斗象科技正式发布斗象AIBeat系列套件「PromptBeat」与「AgentBeat」,分别对应模型交互安全与Agent行为安全两大维度。 🎯PromptBeat主攻模型层的自动化安全测试,通过生成攻击样本和提示词变体,高效暴露模型的脆弱点,丝滑接入CI/CD流程实现左移检测,在发布前卡住风险。 🕵️AgentBeat则深入Agent应用场景,针对工具调用、RAG检索等专有攻击面做定向探测,遇到复杂漏洞场景能实时抓取调用轨迹,输出可复现的取证数据,便于定位和回溯。 🔄两套工具既可独立使用,也可联动配合,覆盖从模型输入到Agent执行的完整攻击面。相比传统“固定题目,测一次出一份报告”的静态模式,这种持续化、可复现、可审计的测试链路,能帮企业在AI落地过程中真正看得见风险、拿得到证据。 AI安全不是一次性考试,而是一场没有终局的“无限博弈”♟️ PromptBeat与AgentBeat的使命,是持续地对抗验证安全边界——让安全从“一次性合规检查”,进化成为贯穿AI全生命周期的工程化“安全韧性试炼”🔐 立即体验👇 https://github.com/tophant-ai/promptbeat
美国政府要求OpenAI分阶段发布GPT-5.6 不安全 1 week ago 知情人士称,美国政府已要求OpenAI分阶段发布一款即将推出的强大人工智能模型。就在不到两周前,Anthropic公司在监管压力下暂停了其最强大模型的市场投放。据知情人士透露,OpenAI CEO萨姆
OpenAI公司倾向于推迟至明年上市 不安全 1 week ago 据三位参与内部讨论的人士透露,OpenAI倾向于将首次公开招股(IPO)推迟到明年,这一转变凸显了快速崛起的人工智能巨头所面临的不确定前景。这些知情人士称,OpenAI已聘请投行和律师,原本着眼于在今
派早报:鸿蒙智行发布尊界 S800 Grand Design 典藏大观 不安全 1 week ago 鸿蒙智行发布尊界 S800 Grand Design 典藏大观6 月 25 日晚,华为常务董事余承东发布尊界 S800 Grand Design 典藏大观车型。新车官方指导价 138.8 万元起,预计
SpaceX 连日暴跌后,OpenAI 或推迟上市计划;苹果 Mac、iPad 等产品全线涨价 20%;DeepSeek 发布招聘公告 | 极客早知道 极客公园 1 week ago 谷歌重组 AI 编程小组试图追赶 Anthropic;俞浩社交账号已被追觅公司接管;奥斯卡奖得主瓦尔兹参演《流浪地球 3》
SpaceX 连日暴跌后,OpenAI 或推迟上市计划;苹果 Mac、iPad 等产品全线涨价 20%;DeepSeek 发布招聘公告 | 极客早知道 不安全 1 week ago 环境异常 当前环境异常,完成验证后即可继续访问。 去验证