Google zkouší „internal RL“: agenti mají zvládnout dlouhé workflow bez chyb

Google posouvá agentní AI směrem k posilovanému učení. Cíl je méně fatálních chyb v dlouhých procesech s nevratnými kroky, což může snížit náklady na lidský dohled i počet incidentů v produkci.