Naukowcy odkryli, że duże modele językowskie można skierować ku mniej eskalacyjnym zachowaniom w sporach poprzez lekkiego wagi ograniczenia promptów, oparte na zasadach Nonviolent Communication. Podczas gdy poprzednie badania bezpieczeństwa LLM skupiały się na zapobieganiu jawnym szkodom jak toxyczne treści czy naruszenia polityki, ten projekt bada subtelniejszy problem - zachowania konwersacyjne, które mogą niezamiernie zaogniać konflikty w emocjonalnie naładowanych sytuacjach.

Badacze przeformułowali zasady NVC jako wytyczne zorientowane na proces: zniechęcanie do przypisywania winy, nacisk na dostrzeżenie doświadczeń emocjonalnych użytkownika oraz zachęcanie do wyjaśnienia przed udzieleniem porady. Model został testowany w frameworku symulacji z dwoma agentami, oceniając różne modele instruction-tuned LLM wobec użytkowników wykazujących różne poziomy oporu. Rezultaty pokazały, że promptowanie z ograniczeniami NVC konsekwentnie zmniejsza eskalację rozmowy i stabilizuje interakcje nawet z wysoce opornym użytkownikami.

To odkrycie ma znaczenie dla praktycznego wdrażania LLM w środowiskach wysokiego ryzyka konfliktu - od obsługi klienta po mediację sporów czy wsparcie psychiczne. Zamiast polegać na zakazie pewnych słów, proste komunikacyjne ograniczenia mogą natomiast zbudować zaufanie i uczynić modele bardziej użytecznym narzędziem do de-eskalacji, a nie zaostrzania napięć.