Thử thách tuân theo hướng dẫn: Mọi mô hình đều thất bại ở một điểm nào đó — DeepSeek đạt 6,76. Thử thách gồm 6 ràng buộc, bao gồm viết tiếng Anh tự nhiên mà không có chữ "e". #TuânThủHướngDẫn #ThửThách #MôHìnhTríTuệNhânTạo #AI #MachineLearning #DeepLearning #InstructionFollowing #Benchmark
https://www.reddit.com/r/LocalLLaMA/comments/1qm3iya/instruction_following_benchmark_6_constraints/
