Phân lớp dữ liệu thuyền viên cho dự báo phát triển nguồn nhân lực thuyền viên xuất khẩu

28/02/2018 09:34

Việt Nam có tiềm năng rất lớn trong xuất khẩu thuyền viên (XKTV), tuy nhiên hiện tại, vấn đề XKTV đang gặp rất nhiều khó khăn và bộc lộ những điểm hạn chế nhất định khi sự tăng trưởng thiếu bền vững, năng lực cạnh tranh kém...

ThS. NCS. ĐÀO QUANG DÂN

PGS. TS. ĐINH XUÂN MẠNH

TS. NGUYỄN TRỌNG ĐỨC

Trường Đại học Hàng hải Việt Nam

TÓM TẮT: Việt Nam có tiềm năng rất lớn trong xuất khẩu thuyền viên (XKTV), tuy nhiên hiện tại, vấn đề XKTV đang gặp rất nhiều khó khăn và bộc lộ những điểm hạn chế nhất định khi sự tăng trưởng thiếu bền vững, năng lực cạnh tranh kém... Vì vậy, cần thiết phải có sự thống kê đầy đủ và chi tiết về số lượng thuyền viên và phân lớp thuyền viên theo các tiêu chí cụ thể. Trong bài báo, nhóm tác giả đề xuất bộ tiêu chí chung nhất cho các thuyền viên xuất khẩu (TVXK) dựa trên việc thu thập dữ liệu từ các công ty XKTV hàng đầu cũng như các nhà tuyển dụng; xây dựng cơ sở dữ liệu (CSDL) thuyền viên theo các tiêu chí và phân lớp dữ liệu nhằm xây dựng hệ thống dự báo phát triển nguồn nhân lực TVKX của Việt Nam.

TỪ KHÓA: Thuyền viên xuất khẩu, phân lớp dữ liệu, mô hình dự báo.

Abstract: Vietnam has been holding a great potential in supplying seafarers. However, exporting seafarers in Vietnam has dealt with many difficulties and has revealed some specified shortcomings including limitations in growth, instability, weak competition… Hence, it is necessary to obtain sufficient and detailed statistics for the number of seafarers and to classify seafarers according to particular criteria. In this paper, authors propose a code of integrated criteria for seafarers based on data that is collected from the top Vietnamese exporting seafarers companies as well as the employer of seafarers. Database of seafarers is built up according to criterion and is classified in order to set up a system of forecasting the development of human resource for exporting seafarers in Vietnam.

Keywords: Working aboard seafarers, classify data, forecasting model

1. ĐẶT VẤN ĐỀ

Thuyền viên là bộ phận nòng cốt đặc biệt quan trọng trong việc quản lý, bảo dưỡng và vận hành an toàn tàu biển. Việt Nam hiện có khoảng 50000 thuyền viên, bao gồm thuyền trưởng, sĩ quan, thủy thủ và thợ máy [1]. Tuy nhiên, chất lượng thuyền viên Việt Nam không đồng đều, tùy thuộc vào cơ sở đào tạo, tinh thần, thái độ, trình độ chuyên môn và sự phân công vị trí cũng như đội tàu mà thuyền viên làm việc. Đội ngũ thuyền viên Việt Nam phần lớn chỉ được trang bị kiến thức chủ yếu về lý thuyết, chưa được đào tạo nhiều về kỹ năng, tinh thần và thái độ đối với nghề nghiệp. Thêm vào đó, số thuyền viên Việt Nam sử dụng thành thạo tiếng Anh còn chiếm tỷ lệ khá thấp.

Có nhiều cách đánh giá khác nhau về chất lượng đội ngũ thuyền viên, xuất phát từ các quan điểm, vị trí khác nhau của người đánh giá. Tuy nhiên, yêu cầu chung cho các thuyền viên được thể hiện qua các mặt: Trình độ, kiến thức, kỹ năng làm việc, tay nghề, tinh thần và thái độ làm việc. Thuyền viên ở bất kỳ chức danh nào cũng đều phải biết nghe và tiếp thu sự hướng dẫn, biết phối hợp làm việc theo nhóm.

Với TVXK, Việt Nam có tiềm năng rất lớn, tuy nhiên trong suốt hơn 20 năm qua, số lượng TVXK chỉ dao động quanh con số 3000 người/năm [2]. Hiện tại, vấn đề XKTV đang gặp rất nhiều khó khăn và bộc lộ những điểm hạn chế nhất định khi sự tăng trưởng thiếu bền vững, năng lực cạnh tranh kém..., dẫn đến tình trạng phổ biến hiện nay đó là vừa thừa, vừa thiếu TVXK. Từ những vấn đề trong thực tế, bài toán đặt ra là phải dự báo được sự phát triển nguồn nhân lực thuyền viên, giúp các nhà hoạch định chính sách, các nhà quản lý, các doanh nghiệp và cơ sở đào tạo có cái nhìn tổng quan về vấn đề, từ đó đưa ra những chiến lược phát triển nguồn nhân lực TVXK một cách đồng bộ, toàn diện. Như vậy, cần thiết phải có sự thống kê đầy đủ và chi tiết về số lượng thuyền viên và phân lớp thuyền viên theo các tiêu chí cụ thể.

Trong bài báo, nhóm tác giả đề xuất bộ tiêu chí chung nhất cho các TVXK dựa trên việc thu thập dữ liệu từ các công ty XKTV hàng đầu cũng như các nhà tuyển dụng. Xây dựng CSDL thuyền viên theo các tiêu chí và phân lớp dữ liệu nhằm xây dựng hệ thống dự báo phát triển nguồn nhân lực TVKX của Việt Nam.

2. XÂY DỰNG CSDL THUYỀN VIÊN

Trên cơ sở tìm hiểu và nghiên cứu, đối tượng thuyền viên hiện tại được chia làm 3 nhóm chính:

Thuyền viên làm cho các công ty quốc tế (xuất khẩu);

Thuyền viên làm cho các công ty vận tải trong nước;

Thuyền viên khác.

Trong mỗi nhóm, các đối tượng được phân lớp theo các khối, với nhóm TVXK, các khối có thể: Khối làm việc cho chủ tàu lớn, khối làm việc cho các chủ tàu vừa và nhỏ. Tương tự như vậy, với nhóm thuyền viên làm việc cho các công ty vận tải trong nước. Bảng 2.1 chỉ ra một ví dụ về đánh giá TVXK theo các tiêu chí của Công ty VINIC, dữ liệu được lưu thể hiện và lưu trữ theo khuôn dạng văn bản (Word), bảng tính (Excel).

Trên cơ sở thông tin do các công ty cung ứng và sử dụng lao động thuyền viên, đơn vị đào tạo, nhóm tác giả đã xây dựng một bộ CSDL thuyền viên mang tính tổng quát với các tiêu chí cần thiết, bao gồm: Kiến thức chuyên môn, trình độ chuyên môn, thái độ, kỹ năng, thể chất, tiếng Anh, làm việc nhóm, động lực đào tạo thuyền viên cấp dưới và khả năng lãnh đạo…

Bảng 2.1. Đánh giá TVXK theo các tiêu chí [3]

danbang2.1

Khuôn dạng các bảng thể hiện trong Hình 2.1. Hình 2.1a thể hiện các trường và khuôn dạng dữ liệu tương ứng cho CSDL thuyền viên, Hình 2.1b thể hiện các trường và khuôn dạng dữ liệu cho thuộc tính kỹ năng của thuyền viên.

dan2.1

Hình 2.1: CSDL thuyền viên

dan2.1.1

 

3. PHÂN LỚP DỮ LIỆU THUYỀN VIÊN

3.1. Bài toán phân lớp dữ liệu

Phân lớp dữ liệu xác định một hàm ánh xạ từ một mẫu dữ liệu vào một trong số các lớp đã được biết trước đó dựa trên đặc trưng của tập dữ liệu [4]. Các kỹ thuật phân lớp có thể sử dụng: Cây quyết định, mạng noron, giải thuật di truyền… Trong khuôn khổ bài báo, nhóm tác giả đi sâu tìm hiểu kĩ thuật phân lớp dùng cây quyết định và ứng dụng trong phân lớp CSDL thuyền viên đã xây dựng.

Cây quyết định là một dạng cấu trúc mô tả tri thức dưới dạng cây nhằm phân các đối tượng dữ liệu thành một số lớp nhất định [5]. Với cây quyết định như trong Hình 3.1, thuộc tính phân lớp được xác định là “xuất khẩu” được hay không đối với mỗi thuyền viên. Khi kiến thức CM < 5.0, kết luận đưa ra là không thể xuất khẩu (theo nhánh cây con trái), tuy nhiên khi kiến thức CM ≥ 5.0, các thuộc tính khác (nhánh cây con phải) sẽ được xét đến. Kết quả là, dữ liệu thuyền viên sẽ được phân thành hai lớp chính: “Xuất khẩu” và “Không xuất khẩu được”.

dandan.1
Hình 3.1: Cây quyết định

3.2 Phân lớp dữ liệu thuyền viên

Như đã trình bày trong mục 1, sau khi xây dựng CSDL thuyền viên Việt Nam, dữ liệu được phân lớp nhằm xây dựng hệ thống dự báo phát triển nguồn nhân lực TVKX. Quy trình thu thập và phân lớp dữ liệu thuyền viên được mô tả như trong Hình 3.2.

dan3.2
Hình 3.2: Quy trình thu thập và phân lớp dữ liệu thuyền viên

Từ dữ liệu hồ sơ thuyền viên đầu vào, dữ liệu được trích chọn theo các đặc trưng là các thuộc tính tương ứng với các yêu cầu đối với TVXK. CSDL thuyền viên sau khi trích chọn đặc trưng sẽ được sử dụng làm tập mẫu để phân lớp và xây dựng tập luật dùng cây quyết định. Trên cơ sở các tập luật, mô hình dự báo được xây dựng.

Thu nạp dữ liệu: Dữ liệu thuyền viên được thu thập, tổ chức như trong mục 2.

Trích lọc dữ liệu: Dữ liệu được thu gọn theo chức danh của thuyền viên (Sỹ quan quản lí, sĩ quan vận hành, thợ máy...) với các thuộc tính: Kiến thức, trình độ chuyên môn, kỹ năng, ngoại ngữ, thể chất, khả năng làm việc nhóm…

Rời rạc hóa dữ liệu: Việc rời rạc hóa các thuộc tính trong bộ CSDL thuyền viên được thực hiện bằng phần mềm Weka [6]:

Dữ liệu sau rời rạc có dạng:

ThuyThu               KTCM4 TDCM4 TD2        KyN4     TheChat1              TAnh2   VNhom3

ThuyThu               KTCM2 TDCM1 TD1        KyN1     TheChat2              TAnh2   VNhom1

ThuyThu               KTCM4 TDCM3 TD2        KyN3     TheChat2              TAnh2   VNhom2

ThuyThu               KTCM3 TDCM3 TD1        KyN1     TheChat3              TAnh2   VNhom1

ThuyThu               KTCM3 TDCM2 TD1        KyN1     TheChat3              TAnh2   VNhom0

ThuyThu               KTCM3 TDCM2 TD1        KyN1     TheChat3              TAnh2   VNhom1

ThuyThu               KTCM3 TDCM1 TD1        KyN1     TheChat1              TAnh1   VNhom0

Tạo cây quyết định: Trên cơ sở bộ CSDL thuyền viên đã xây dựng, quy trình phân lớp dữ liệu nhằm đưa ra các dự báo được thực hiện dựa trên cây quyết định như chỉ ra trong Hình 3.3.

dan3.3
Hình 3.3: Cây quyết định theo thuộc tính trình độ chuyên môn

Xây dựng tập luật: Tập luật theo thuộc tính này sẽ có dạng:

Rule 1: Nếu kỹ năng chuyên môn thuộc nhóm 0 (KyN0) thì có việc làm (thợ máy).

Rule 2: Nếu kỹ năng chuyên môn thuộc nhóm 1 (KyN0) và trình độ chuyên môn thuộc nhóm 1 (TDCM1) thì không có việc làm (trên bờ).

Rule 3: Nếu kỹ năng chuyên môn thuộc nhóm 1 (KyN0) và trình độ chuyên môn thuộc nhóm 1 (TDCM0) và kiến thức chuyên môn thuộc nhóm 0 (KTCM0) thì không có việc làm…

Với dữ liệu mẫu ban đầu gồm 17660 bản ghi (hồ sơ thuyền viên), dữ liệu được chia làm hai tập: 12500 bản ghi tập mẫu (70%), 5160 bản ghi kiểm thử. Quá trình phân lớp cho tỉ lệ như chỉ ra trong Bảng 3.1.

Ở lần thứ nhất kết quả phân lớp đạt 80.5%, tương ứng với 4153 bản ghi được phân lớp chính xác. Tương tự với các lần thử nghiệm 2, 3, 4 và 5.

Đối sánh kết quả thử nghiệm với thực tế tại Công ty XKTV VINIC, việc thuyền viên có đủ điều kiện để xuất khẩu, 256 thuyền viên còn lại phải bổ sung về kỹ năng (237), trình độ chuyên môn (147)… để có thể đáp ứng được yêu cầu của các nhà tuyển dụng nước ngoài.

Bảng 3.1. Kết quả phân lớp dữ liệu thuyền viên

 

Lần đánh giá

Kết quả%

 1

80.5

 2

92.3

 3

85.6

 4

84.7

 5

79.5

Trung bình

84.5

4. KẾT LUẬN

Vấn đề XKTV của Việt Nam đã và đang đặt ra nhiều khó khăn, thách thức cho các nhà hoạch định chiến lược, các doanh nghiệp và cơ sở đào tạo nguồn nhân lực phục vụ cho kinh tế biển. Từ những vấn đề trong thực tế, bài toán đặt ra là phải đánh giá đúng thực trạng nguồn nhân lực, tiềm năng và thị trường TVXK và đưa ra những dự báo mang tính vĩ mô về sự phát triển nguồn nhân lực này. Trong bài báo, nhóm tác giả đã đề xuất bộ tiêu chí chung nhất cho các TVXK dựa trên việc thu thập dữ liệu từ các công ty XKTV hàng đầu cũng như các nhà tuyển dụng. Xây dựng và phân lớp CSDL thuyền viên theo nhiều tiêu chí. Kết quả thử nghiệm đã được đối sánh với bài toán thực tế tại Công ty XKTV VINIC, Công ty Cổ phần Hàng hải Liên Minh cho thấy, việc phân lớp dữ liệu dùng cây quyết định và thuật toán CD5 là hoàn toàn phù hợp. Sự phân lớp dữ liệu TVXK này sẽ cho phép xây dựng mô hình dự báo phát triển nguồn nhân lực TVKX của Việt Nam trong tương lai một cách chính xác và khoa học.

Tài liệu tham khảo

[1]. Thống kê số lượng thuyền viên của Cục Hàng hải Việt Nam tính đến ngày 30/3/2015.

[2]. Tổng hợp số liệu từ các doanh nghiệp XKTV, giai đoạn 1992 - 2015.

[3]. Các tiêu chí đánh giá chất lượng TVXK của Công ty VINIC năm 2016.

[4]. D. Hand, H. Mannila and P. Smyth (2001), Principles of Data Mining, The MIT Press, London, England.

[5]. Lior Rokach, Oded Maimon (2008), Data mining with decision trees Theory and Applications, World Scientific Publishing.

[6]. Https://www.cs.waikato.ac.nz/ml/weka/index.html.

Ý kiến của bạn

Bình luận