On 15/02/26 20:54, VITRIOL wrote:
> Il 15/02/2026 20:12, son ha scritto:
>
>> Io faccio fatica a credere a simili osservazioni.
>
> Sono cose pubblicate nei system card, i corposi documenti
> rilasciati con ogni nuovo modello. Il generale però i test
> vengono condotti in condizioni poco realistiche, con tutte
> le sicurezze abbassate e con sequenze di prompt
> specificamente mirate a ingannare il modello. Si ricerca
> proprio gli scenari peggiori.
> Fino a quando si tratta di chatbot il problema è più o meno
> limitato (1), anche se dice cose non le può fare. Ma se è un
> agente è un po' diverso, e si sa che gli scenari peggiori
> prima o poi succedono.
> A livello divulgativo queste cose le racconta bene Enkk,
> mettendole in prospettiva.
>
> (1) Dico così ma non è che ci credo tanto, perché bisogna
> mettere in conto anche la stupidità (a volte solo la
> fragilità) degli esseri umani.
>
io ho chiesto a Grok info sul radar cinese UHF e il
comportamento delle vernici radar absorbing di F35 e B2
spirit, ottenendo una negazione in inglese (dati sensibili).
Il modello non è nudo ed esposto all'utenza. Ci sono filtri,
prima e dopo di esso.
--
1) Resistere, resistere, resistere.
2) Se tutti pagano le tasse, le tasse le pagano tutti
MarioCCCP