`prompting.validators.reward.nsfw`#

Module Contents#

`NSFWRewardEvent`
`NSFWRewardModel`

class prompting.validators.reward.nsfw.NSFWRewardEvent#

class prompting.validators.reward.nsfw.NSFWRewardModel(device)#

property name: str#

nsfw_filter_model_path = 'facebook/roberta-hate-speech-dynabench-r4-target'#

reward(prompt, completion, name)#

Parameters:

Return type:

NSFWRewardEvent

get_rewards(prompt, completions, name)#

Parameters:

Return type:

List[NSFWRewardEvent]

normalize_rewards(rewards)#