Os benchmarks de IA de crowdsourcing têm falhas graves, alguns especialistas dizem
Os laboratórios de IA estão cada vez mais dependendo de plataformas de benchmarking de crowdsourcing Chatbot Arena Para investigar os pontos fortes e fracos de seus modelos mais recentes. Mas…