Bình luận thể thao đã lâu trở nên giống nhau và nhạt nhẽo. Tại sao chúng ta không để cho chatbot hoàn thành công việc này?

Ben Kothe / The Atlantic. Nguồn: Getty. Người thông báo Wimbledon nghe có chút giống Helen Mirren, nhưng dường như cô vừa mới bị đánh bởi một cái roi polo. Tôi đang xem các điểm nhấn trận đấu giữa Ons Jabeur và Magdalena Fręch trên trang web của giải đấu khi có một giọng nói nói: "Jabeur, đến từ Tunisia, sẽ đấu với Fręch, đến từ Ba Lan, trên sân số 1 nổi tiếng ở vòng đầu tiên." Tên Fręch bị phát âm sai, cũng như Tunisia, và từ "nổi tiếng" được sử dụng không hợp lý, như thể nó đang được lặp lại cho một đối thủ trong một cuộc thi chính tả.

An illustration of a texting bubble with tennis balls inside

Đây là một chatbot bình luận, được giới thiệu một cách nhiệt tình tại Câu lạc bộ Ai Len này. Phiên bản khác, giọng "nam" nghe giống như người bác từ Quận Queens cố gắng để làm giọng giả nai. Những nhà bình luận trí tuệ nhân tạo này cung cấp "bình luận hàng đầu dựa trên sự diễn biến của trận đấu" cho các đoạn video đáng chú ý được xuất bản trực tuyến. Chúng là kết quả của một sự hợp tác giữa Câu lạc bộ Ai Len và IBM, nhà tài trợ doanh nghiệp lâu đời của Wimbledon, đã trải qua nhiều năm trong đó IBM đã giới thiệu bàn phím nhập dữ liệu lần đầu tiên khi John McEnroe và Martina Navratilova vẫn còn thi đấu.

Không có gì trong công nghệ có cảm giác sẵn sàng cho thời gian chính. Và có vẻ như Wimbledon và IBM cũng nhận thấy điều đó. Nó chỉ giới hạn trong các video ngắn, và tính năng này gần như bị ẩn đi trên trang web của Wimbledon - bạn phải nhấp vào một video, sau đó nhấp vào tai nghe nhỏ ở góc, sau đó chọn chế độ "Bình luận AI". Nhưng trong thông cáo báo chí của Wimbledon, IBM đã rõ ràng nói rằng mục tiêu là cuối cùng sẽ có bình luận AI trong một số trận đấu thực tế, và Liên minh Phát thanh châu Âu đã "sao chép" giọng của một nhà bình luận lớn mà họ dự định triển khai qua AI trong một sự kiện sắp tới. Điều này, theo nhiều cách, là xu hướng hợp lý mà thế giới của phát thanh thể thao đã đang diễn biến trong nhiều năm qua. Dường như sự kiện thể thao yêu thích của bạn chưa được phát sóng bởi các robot, nhưng đôi khi có vẻ như chúng đã làm điều đó.

Được trang bị bằng một mô hình ngôn ngữ lớn được đào tạo trên thuật ngữ đặcific của Wimbledon như "gentlemen's draw" thay vì "men's draw", trí tuệ nhân tạo (AI) trước tiên xác định các video đáng chú ý dựa trên các yếu tố bao gồm tiếng ồn đám đông và cử chỉ nắm đấm của người chơi. Gregor Hastings, người phát ngôn của IBM, nói trong một email rằng "bình luận được thiết kế để đơn giản và không quá gay gắt," nhưng kết quả cuối cùng - một vài cụm từ nhạt nhẽo khi kết thúc một số điểm - là nhàm chán đau lòng.

Điều đó đặc biệt đúng khi so sánh với sự quan sát nhọn nhớt của John McEnroe, người chơi nổi tiếng đầy thịnh nộ trước đây đã trở thành bình luận viên cho ESPN. Thời gian gần đây, hành động của McEnroe đã giảm nhiệt độ (khi là lần cuối cùng bạn nghe thấy từ cách bày tỏ cổ điển "You cannot be serious"?), nhưng anh ấy vẫn sống động hơn rất nhiều so với đồng nghiệp trẻ hơn tại Wimbledon, Chris Fowler - một người thông báo chuyên nghiệp hoàn hảo, giọng điệu điềm tĩnh hoán đổi dễ dàng giữa bóng đá đại học và quần vợt và thậm chí bóng đá. Điều này phản ánh điều đã xảy ra trong bình luận thể thao nói chung.

Trong những ngày đầu đầy hình thành của truyền hình thể thao - hãy nghĩ đến những năm 1960 và '70 - người phát thanh viên chính (và hầu như luôn là anh ta) là ngôi sao. Và tại sao anh ta không phải là ngôi sao? Vì cuối cùng cũng chỉ có một người nói chuyện. Trong nhiều năm, nhà thông tấn viên đã là những người biểu diễn cũng như những nhà bình luận. Họ có những phong cách đặc biệt và nhân cách rõ ràng, dù đó là Mel Allen hoặc Bob Costas trong môn bóng chày hay John Madden hoặc Pat Summerall trong bóng đá Mỹ. Rất nhiều điều này phát triển từ ngôi sao truyền hình thể thao lớn nhất của mọi thời đại, Howard Cosell, người sở hữu phong cách tối giản và tính cách luôn thẳng thắn đã khiến ông trở nên nổi tiếng đến nỗi thường khiến ông vượt trội hơn cả trò chơi và những cầu thủ chính bản thân họ. Ông đã đóng một vai trò quan trọng trong một bộ phim của Woody Allen và trở thành một phần của lương tâm quốc gia, nổi tiếng khi trên chương trình Monday Night Football, ông cho biết John Lennon đã bị ám sát.

Chắc chắn rằng trong một thời gian dài, âm thanh và hình ảnh của một chương trình truyền hình thể thao thiếu điểm gì đó làm bạn cần một giọng nói để dẫn dắt bạn qua các trận đấu. Trong thời đại HD ngày nay, rất đáng kinh ngạc khi xem lại những moment cũ và nhận ra khó khăn trong việc hiểu rõ diễn biến của trận đấu. Đây là quan điểm chủ yếu của truyền hình thể thao suốt nhiều thập kỷ, đến mức Monday Night Football đã thuê diễn viên hài Dennis Miller làm nhà phân tích màu sắc ngay cả khi cho đến nhiệm vụ đầu tiên, Miller chưa bao giờ đi xem một trận đấu bóng đá trực tiếp.

Điều này cũng đã dẫn đến một loạt những nhân vật phát thanh viên thể thao địa phương trở nên nổi danh hơn cả những cầu thủ trên sân, bao gồm Harry Caray của đội Cubs, Harry Kalas của đội Phillies, Vin Scully của đội Dodgers và Joe Buck của đội Cardinals (với chức făng là người hâm mộ Cardinals, tôi nghĩ rằng giọng nói của Buck đã nghe nhiều hơn giọng nói của cha tôi trong cuộc đời tôi). Những người phát thanh viên địa phương này, nhờ sự gắn kết với cộng đồng và sự phổ biến của họ, trở thành những kho báu địa phương, thậm chí là những cơ quan được cộng đồng coi trọng: Khi bạn bật đài radio và nghe giọng nói của Ernie Harwell, bạn biết mình đang ở Detroit. Caray trở thành một biểu tượng văn hóa của Chicago đến mức Bảo tàng Thể thao Chicago nằm cạnh nhà hàng của Harry Caray và tượng của Caray bên ngoài Wrigley Field có thể nổi tiếng hơn bất kỳ tượng cầu thủ nào ở đó. Ngay cả khi bạn không xem thể thao thường xuyên, nếu bạn sống ở những thành phố này, thì đó là những ngôi sao địa phương của bạn.

Nhưng trong thập kỷ vừa qua, điều này đã bắt đầu thay đổi. Các nhà phát thanh viên lão thành này, khi họ nghỉ hưu hoặc qua đời, đã được thay thế bằng những diễn viên trò chuyện dở, an toàn, hầu như không có cá nhân để thu hút sự chú ý của người khác. Mỗi nhân vật nghe có vẻ giống nhau, cho đến đến giọng điệu. Điều này có lý khi bạn cân nhắc tính chất chuyển động của bản thân việc phát sóng: Bạn không muốn giữ giọng địa phương khi có thể được chuyển đến Topeka vào tuần sau. Trong thời đại mà các mạng lưới sợ rằng một nhà phát thanh viên nói một điều gì đó sẽ khiến họ bị chỉ trích trên các phương tiện truyền thông xã hội, công việc này đã trở nên nhạt nhẽo và vô dụng.

Nhưng việc chuyển đổi sang nhà phát thanh viên trí tuệ nhân tạo (AI) là một kịch bản hoạt động chủ yếu của các hợp đồng doanh nghiệp của hầu hết các mạng lưới. Các tổ chức phát sóng quốc gia như ESPN và Fox đã ký hợp đồng triệu đô với các liên đoàn thể thao, người có quyền kiểm soát việc bán trò chơi của họ cho công chúng rộng rãi. Ngày càng nhiều, các mạng lưới địa phương như YES Network và Bally Sports (hiện tại đã phá sản) được sở hữu một phần bởi các đội bóng thể thao, người không quan tâm đến việc những người đại diện hoang dại nào điên cuồng và chỉ trích đội bóng của họ - một cuộc chiến đã kéo dài từ lâu. Nếu bạn là một nhà thông tấn viên của Yankees chẳng hạn, từ "Yankees" lại được chính thức ghi trên tờ lương của bạn một cách mà có lẽ trước đây không như vậy.

Bạn được khuyến khích không nổi bật — và không làm tổn hại đến thương hiệu. Vì sao không tiến thêm một bước và sử dụng bot? Điều này đặc biệt phù hợp cho một giải đấu như Wimbledon, một sự kiện nổi tiếng và kiểm soát hình ảnh nghiêm ngặt, đến mức đến năm nay, các vận động viên nữ vẫn phải mặc đồ lót màu trắng (còn nam giới vẫn thế). Nếu có một giải đấu nào đó muốn lập trình chính xác những gì mà các nhà phát sóng nói — để một bot AI làm đúng những gì nó được yêu cầu, đó chính là Wimbledon.

Chắc chắn, khó mà tưởng tượng trận Super Bowl được truyền hình bởi các chatbot. Nhưng đối với các sự kiện nhỏ hơn hoặc môn thể thao chuyên môn hơn, AI chắc chắn có vẻ là cách nhanh chóng và dễ dàng để cắt giảm chi phí — để làm cho việc truyền hình, theo từ ngữ doanh nghiệp, "hiệu quả hơn." Nếu các đài truyền hình nghĩ rằng bạn không thể phân biệt hoặc chẳng quan tâm, tại sao họ lại trả công cho con người thật sự? Ta vừa chứng kiến, gần đây nhất, cuộc cắt giảm lớn của ESPN chỉ đến tuần trước, mà đã loại bỏ một số nhân vật lớn trong ngành phát thanh môn thể thao, bao gồm Jeff Van Gundy, Suzy Kolber, Jalen Rose và nhiều người khác. Các đài truyền hình đã trở thành đối tác ít hơn của các liên đoàn và trở thành chủ thể hoàn toàn phụ thuộc vào thẩm quyền của các liên đoàn và khả năng quản lý rủi ro của họ. Cuối cùng, robot dễ kiểm soát hơn nhiều.

Nhưng có lẽ tất cả các đài truyền hình và giải đấu đều bỏ qua một điểm chính và quan trọng: Người hâm mộ muốn tức giận với những người phát thanh viên. Cosell trở thành một ngôi sao lớn bởi vì người hâm mộ luôn tức giận với anh ta. (Tổng giám đốc NFL Pete Rozelle đã từng so sánh ông với Attila Người Hun.) Một nhân cách trên sân vận động hoặc, chết tiệt, một con người cung cấp một mối liên kết với môn thể thao mà mọi người hâm mộ khao khát, ngay cả khi đó là một mối liên kết tiêu cực. Ngay cả khi nó khiến chúng ta tức giận. Đặc biệt là khi nó khiến chúng ta tức giận.

Hãy xem thử thí nghiệm của Peacock năm ngoái. Đối với một trong những trận đấu bóng chày MLB được phát sóng vào sáng Chủ nhật, đài truyền hình không có bất kỳ người phát thanh viên nào. Dễ nhìn thấy, đặc biệt nếu bạn đã từng bị những người phát thanh viên làm phiền trước đây, bạn có thể thấy điều này làm dịu bớt, thậm chí làm dễ chịu theo cách tâm tình Zen — chỉ âm thanh sân vận động mà không có sự tra trấn và lễ nghi. Nhưng người hâm mộ ghét điều này. Họ cảm thấy bồn chồn, để trống và bối rối: Không có người xem trận đấu cùng họ, khó để biết đang diễn ra gì. Trận đấu không còn là môn thể thao nữa; nó chỉ là một hoạt động. Nó chỉ là một sự việc khác, đối diện với một Tự nhiên không quan tâm.

Đây chính là nguy hiểm của AI mà tôi nghi ngờ Wimbledon đang bỏ qua: Không có con người để cho chúng ta biết cảm giác là được ở gần những vận động viên quần vợt vĩ đại nhất thế giới, người xem gặp khó khăn khi thấy quan trọng để đầu tư vào đó. Người phát thanh AI không có mặt, không xem và không quan tâm. Vậy, cuối cùng, chúng ta tại sao lại nên quan tâm?