Công việc mà nhóm của Li đang làm là khoanh từng ô trong khung hình, sau đó chú thích đây là vật gì. Ảnh: SCMP. |
Tốt nghiệp đại học luật, nhưng John Li, thanh niên 24 tuổi nắm rất rõ về những tiến bộ hàng đầu của Trung Quốc trong ngành xe tự lái. Anh hiểu rõ những cảm biến của xe tự lái sẽ thu thập và xử lý dữ liệu thế nào, dù chưa một lần tận mắt nhìn thấy xe tự lái tại tỉnh Quý Châu, miền tây nam Trung Quốc nơi Li sinh sống.
Li là người quản lý nhóm 100 nhân viên dán nhãn. Công việc chính của nhóm anh là kẻ các ô vào khung hình mà camera trên xe tự lái trên cả nước ghi lại được, sau đó chú thích vào đấy ô nào là xe hơi, ô nào là xe đạp, đâu là người đi đường, và các biển báo giao thông khác.
Thủ phủ dán nhãn của Trung Quốc
Những dữ liệu đã xử lý, dán nhãn này sau đó sẽ được chuyển về cho các công ty để họ huấn luyện các thuật toán tự học cho trí tuệ nhân tạo. Khách hàng của Li bao gồm những công ty công nghệ hàng đầu Trung Quốc như Alibaba, Baidu.
"Công việc của tôi là đưa ra dữ liệu chuẩn cho xe tự lái, và tôi đang góp một phần nhỏ vào sự phát triển của công nghệ", Li cho biết. Đây cũng là cách anh giải thích về công việc của mình với gia đình, bạn bè, những người không rõ dán nhãn dữ liệu là gì.
Ngoài mô tả hình ảnh, nhóm của Li đôi lúc còn phải nghe và viết lại những gì mình đã nghe được, với phương ngữ từ đủ mọi miền của Trung Quốc. Họ cũng có lúc phải nhận diện và phân biệt giữa mặt người, khuôn mặt của thú, hay nhảy theo các điệu trên TikTok để huấn luyện bộ nhận biết chuyển động trên ứng dụng này.
Công ty dữ liệu của Li nằm ở một thị trấn nhỏ, sâu trong vùng núi của Quý Châu. Họ nằm cách những trung tâm công nghệ của Trung Quốc như Bắc Kinh, Thượng Hải, Hàng Châu hay Thâm Quyến hàng nghìn km.
Mô hình hoạt động của họ có phần nào giống với cách mà Trung Quốc trở thành "công xưởng thế giới". Những thương hiệu của Hong Kong, Đài Loan đều mở nhà máy ở Trung Quốc để tận dụng nguồn nhân công giá rẻ và dồi dào. Giờ đây công việc dán nhãn dữ liệu cũng cần sức người, nhưng an toàn và ít ảnh hưởng tới sức khỏe hơn so với sản xuất.
Quý Châu là một trong những tỉnh nghèo nhất Trung Quốc, nhưng họ cũng muốn tận dụng sự phát triển của một trong những công nghệ hiện đại nhất. Những công ty xử lý dữ liệu được hưởng ưu đãi như giá thuê đất rẻ hơn, không tính phí sử dụng mạng và điện trong 3 năm, và mức thuế thấp trong 5 năm.
Thiểm Tây, một tỉnh khác vốn được biết đến với ngành khai thác khoáng sản, cũng đang gia nhập cuộc đua này. Chính quyền Thiểm Tây đặt mục tiêu sẽ có 100 công ty dữ liệu với hơn 10.000 nhân lực vào năm 2022. Tỉnh này muốn trở thành nơi đi đầu về dữ liệu lớn tại Trung Quốc vào năm 2025.
Do nhu cầu về trí tuệ nhân tạo thay đổi liên tục, công việc xử lý dữ liệu cũng thay đổi theo. Vào năm 2017, các công ty Trung Quốc đều tập trung vào xử lý giọng nói do trào lưu loa thông minh, đôi khi một công ty có thể thuê tới hàng nghìn người cho một đơn hàng xử lý dữ liệu. Tuy nhiên, từ cuối năm 2018 các đơn hàng về nhận giọng nói ngày càng ít đi.
"Khi một sản phẩm đã ở bước hoàn thiện, người ta sẽ không cần phải dán nhãn dữ liệu nhiều nữa", giám đốc một công ty xử lý dữ liệu chia sẻ.
Tại các thành phố nhỏ, nhiều người cũng nhận ra công việc không phải mãi mãi. Lượng đơn hàng dán nhãn dữ liệu phụ thuộc lớn vào các công ty công nghệ hàng đầu, và nhiều người đã tính tới chuyện chuyển nghề khi công việc ít đi. Li cho biết anh cũng tính đến chuyển sang ngành khác trong vài năm tới.
"Đây là điều không thể tránh khỏi, nhưng sẽ là điều tốt. Việc này giúp cho ngành dữ liệu ngày càng chuyên nghiệp hơn", Du Lin nhận xét.
Tag:
Bình luận
Thông báo
Bạn đã gửi thành công.