按护栏类别分类
时间: 2024-10-18 13:33:04 | 作者: 按护栏类别分类
快科技4月26日音讯,跟着ChatGPT等生成式人工智能的呈现,渐渐的变多的用户在享用便当的一起发现,AI常常会呈现“不苟言笑的瞎说”的现象,有时乃至会有一些让人细思极恐的讲话。
近来,NVIDIA推出了一款名为NeMo Guardrails的软件,它可以为AI模型设置安全“护栏”,防止AI输出一些不良的内容。
据悉,NeMo Guardrails的实质是一个坐落用户和模型之间的软件层,它可以在模型输出不良内容前进行阻拦和修正。
比方,若用户需求一个针对特定方向的AI,就可经过该软件,来约束AI至输出对应方面的内容,而不议论不相关的论题。
此外,该软件还能使用一个AI模型检测另一个AI模型,假如两个模型输出的答案不一致,软件将直接输出“我不知道”的答复。
经过这样的方式,人工智能“胡言乱语”的状况会得到必定作用下降,一些或许存在风险的回复也可以被直接阻拦。