red-teaming - Artificial Intelligence News Briefing

Browsing: red-teaming

Researchers Warn Of Unchecked Toxicity In Ai Language Models

Chatbots Machine Learning April 22, 2024

Researchers from MIT are using machine learning to develop a “red-team language model” that generates problematic prompts to test chatbots for safety. This approach…

A Faster, Better Way To Prevent An Ai Chatbot From Giving Toxic Responses

AI Policy and Regulation Machine Learning April 17, 2024

Researchers have developed a machine learning technique to improve red-teaming for large language models, making them safer by generating diverse prompts that trigger a…

How Mit Is Teaching Ai To Avoid Toxic Mistakes

AI Policy and Regulation Machine Learning April 15, 2024

MIT researchers have developed a curiosity-driven machine learning technique to enhance AI safety testing, surpassing traditional human red-teaming methods. The technique trains a red-team…

Researchers Find A Faster, Better Way To Prevent An Ai Chatbot From Giving Toxic Responses

Ethics and Safety Machine Learning April 10, 2024

Researchers have developed a machine learning technique to improve red-teaming, a process used to safeguard large language models from generating unsafe or toxic responses.…

Quicker Method To Halt Ai Chatbot’s Toxic Replies

Chatbots Natural Language Processing April 10, 2024

Researchers have developed a machine learning technique to improve red-teaming for large language models, which helps to prevent unsafe or toxic responses from AI…

Subscribe to Updates