Unin

#reinforcement_learning_from_human_feedback

Reinforcement learning from human feedback

Machine learning technique

In machine learning, reinforcement learning from human feedback (RLHF) is a technique to align an intelligent agent with human preferences. It involves training a reward model to represent preferences, which can then be used to train other models through reinforcement learning.

Tue 10th

Provided by Wikipedia

Learn More

This keyword could refer to multiple things. Here are some suggestions:

Reinforcement learning from human feedback Reinforcement learning Fine-tuning (deep learning) Feedback (disambiguation) ChatGPT Claude (language model) Large language model Human-in-the-loop Paul Christiano (researcher) Generative pre-trained transformer

0 searches

This keyword has never been searched before

This keyword has never been searched for with any other keyword.