Badacze opracowali metodę agregacji preferencji użytkowników w systemach crowdsourcingu mobilnego, która zapewnia szczerość odpowiedzi podczas fine-tuningu dużych modeli językowych. Rozwiązanie stanowi odpowiedź na problem zbierania wiarygodnych danych oceniających do trenowania LLM za pośrednictwem urządzeń mobilnych. Technologia może poprawić jakość modeli AI poprzez bardziej niezawodne dane treningowe z rozproszonej grupy anotatorów.
Badania
arXiv CS.LG