Badanie wykorzystujące miarę informacji wzajemnej do modulowania procesów optymalizacji preferencji w modelach AI, potencjalnie poprawiające wyrównanie modeli z ludzkimi preferencjami.
Badania
arXiv CS.LG
Badanie wykorzystujące miarę informacji wzajemnej do modulowania procesów optymalizacji preferencji w modelach AI, potencjalnie poprawiające wyrównanie modeli z ludzkimi preferencjami.