Ứng dụng mạng nơ ron nhân tạo xấp xỉ đường cong đặc tính vào - ra của cảm biến MQ135

10/07/2016 04:53

Bài báo đề xuất ứng dụng mạng nơ ron nhân tạo (MNN) để xấp xỉ đặc tính vào - ra của cảm biến dựa vào bộ mẫu số liệu cho trước.

ThS. Trần Thị Phương Thảo

PGS. TS. Trần Sinh Biên

Trường Đại học Hàng hải Việt Nam

Người phản biện:

TS. Đinh Anh Tuấn

TS. Đào Minh Quân

TÓM TẮT: Bài báo đề xuất ứng dụng mạng nơ ron nhân tạo (MNN) để xấp xỉ đặc tính vào - ra của cảm biến dựa vào bộ mẫu số liệu cho trước. Trên cơ sở đó có thể thực hiện những ý tưởng thông minh hóa cảm biến như tạo ra đặc tính của cảm biến, đáp ứng những yêu cầu khác nhau của hệ đo lường.

TỪ KHÓA: MNN, MLP, MQ135, Multi Layer Perceptron.

Abstract: The paper proposes the way of using artificial neural network (MNN) to approximate In-Out characteristic curve of the sensor based on the available figure sets. And using this goal to create the method of smarting the sensors to form the curvers of the sensor due to diffirent requirements of measurement systems.

Keywords: MNN, MLP, MQ135, Multi Layer Perceptron.

1. ĐẶT VẤN ĐỀ

Các nghiên cứu về mạng nơ ron nhân tạo (MNN) đã được nghiên cứu từ những năm 1990. Rất nhiều bài báo, đề tài trong lĩnh vực nghiên cứu ứng dụng MNN cho các bài toán điều khiển robot, nhận dạng tiếng nói, hình ảnh… đã được công bố như [1, 4, 10, 11].

Một hướng nghiên cứu gần đây hay được ứng dụng đó là sử dụng MNN cho bài toán đo lường để thông minh hóa cảm biến đo lường trong xử lý số liệu như [2, 7, 8, 14, 15 ], trong đó tác giả dùng MNN để tuyến tính hóa và chuẩn hóa đầu ra cho cảm biến nhiệt điện trở đo nhiệt độ, đo nồng độ pH, [14,15] các tác giả dùng MNN Multi Layer Perceptron (MLP) là mạng truyền thẳng để tuyến tính hóa đặc tính cho cảm biến đo nồng độ khí CO, CH4 cũng như ứng dụng cho bài toán “Mũi nhân tạo” để nâng cao độ chính xác khi phát hiện chính xác nồng độ khí nào đó trong một hỗn hợp khí…

Vì những ưu điểm của MNN MLP [10] khi xấp xỉ một hàm phi tuyến nào đó mà MLP được ứng dụng để xấp xỉ đặc tính vào - ra cho cảm biến MQ135 đo nồng độ khí NH3.

2. CẤU TRÚC MẠNG MLP

2.1. Cơ sở lý thuyết

Với các phần tử nơ ron cơ bản, ta có thể xây dựng mô hình cấu trúc mạng bao gồm nhiều nơ ron. Về mặt lý thuyết, ta có thể xây dựng một mạng với cách ghép nối tùy ý, tuy nhiên trong thực tế, để thuận tiện cho việc lập trình tính toán ta sử dụng mô hình mạng MLP, trong đó các nơ ron được xếp thành nhiều lớp, bao gồm lớp đầu vào X, lớp đầu ra Y và một số lớp ở giữa gọi là lớp ẩn. Tại mỗi lớp (trừ lớp đầu vào) ta có các nơ ron, giữa hai lớp có các kết nối có trọng số. Các nghiên cứu đã chứng minh được rằng, ta chỉ cần sử dụng tối đa 2 lớp ẩn là có thể mô hình hóa một hàm phi tuyến với độ chính xác tùy chọn [10].

hinh21
Hình 2.1: Cấu trúc mạng MLP với một lớp vào, một lớp ẩn và một lớp ra

 

Phần lớn chỉ dùng một lớp ẩn, khi đó mạng MLP sẽ gồm có tổng cộng 3 lớp. Cấu trúc một mạng MLP với 1 lớp ẩn được thể hiện trên Hình 2.1.

Để xác định một mạng MLP cho một bài toán ta cần xác định được các thông số cấu trúc và các trọng số ghép nối ứng với một cấu trúc đã lựa chọn. Cụ thể:

- Số kênh đầu vào r và kênh đầu ra K được xác định dựa trên bộ số liệu mẫu.

- Số lớp ẩn: Theo định lý Komogorov, ta chỉ cần tối đa là 2 hai lớp ẩn, cụ thể ta sẽ lựa chọn giữa 3 khả năng là 0, 1 và 2. Mạng có 2 lớp ẩn thường có độ phức tạp lớn và bậc phi tuyến cao, mạng không có lớp ẩn nào phù hợp với các bài toán đơn giản, bậc phi tuyến thấp. Vì vậy, trong thực tế đa số các trường hợp sử dụng 1 lớp ẩn.

- Các hàm truyền đạt: Hàm truyền đạt của lớp ra phụ thuộc chủ yếu vào dải tín hiệu của các giá trị đích.

- Các thông số có thể tham gia vào quá trình điều chỉnh thích nghi (quá trình học) của mạng MLP, đó là các trọng số ghép nối giữa các lớp của mạng MLP.

2.2. Ứng dụng MLP xấp xỉ đặc tuyến vào - ra của cảm biến MQ135

2.2.1. Chọn thông số cấu trúc của MNN

MQ135 là cảm biến khí dạng bán dẫn hay được sử dụng để đo nồng độ khí NH3, đặc tính Vout=f(ppm) của cảm biến MQ135 (Hình 2.2) là đường cong trơn phi tuyến, liên tục, hữu hạn và đơn trị.

Để xấp xỉ đặc tính Vout của cảm biến cho các bài toán đo lường, ta phải dùng mẫu chuẩn cấp cao hơn theo quy chuẩn đo lường hoặc dùng nguồn khí chuẩn để lấy mẫu tín hiệu. Trong trường hợp này, giả sử ta lấy các điểm mẫu như Hình 2.3 để làm bộ số liệu mẫu trong thiết kế mạng nơ ron.

Thông số cấu trúc của MNN MLP được xác định như trong Bảng 2.1.

Bảng 2.1. Thông số cấu trúc của MLP

bang21

 

hinh22
Hình 2.2: Đặc tuyến vào - ra Vout = f (ppm) của cảm biến MQ135 [5]

 

hinh23
Hình 2.3: Các điểm chọn để xấp xỉ đặc tính

Với cấu trúc mạng MLP đã chọn ta đã xấp xỉ được đặc tính vào - ra Vout = f(ppm) của cảm biến (Hình 2.4). Ta nhận thấy dạng dường cong đạt được gần với dạng đường cong lý thuyết của cảm biến với sai số tuyệt đối ∆ppm trung bình trên toàn đặc tính là 2,43 (ppm).

hinh24
Hình 2.4: Đặc tính được xấp xỉ khi dùng MNN MLP

 

2.2.2. Ảnh hưởng của số nơ ron lớp ẩn đến sai số trong quá trình luyện mạng

Để giảm được sai số tuyệt đối ∆ppm trong toàn dải đo xấp xỉ đặc tính, nếu sử dụng phương pháp chọn điểm xấp xỉ, ta có thể tăng nhiều điểm xấp xỉ lên. Tuy nhiên, số liệu này ban đầu được chọn sẵn và không phải lúc nào cũng có nhiều điểm xấp xỉ trong bộ số liệu mẫu, còn nếu dùng phương pháp mạng nơ ron để xấp xỉ thì việc giảm sai số này đơn giản rất nhiều.

Từ những cơ sở lý thuyết MNN [2, 10, 14, 15] có thể xử lý số liệu ngay trong quá trình thiết kế chế tạo MNN của cảm biến. Các kết quả xử lý số liệu được đưa vào bên trong bộ thông số cấu trúc của cảm biến nơ ron, cụ thể là trong quá trình huấn luyện mạng này. Vì bản chất của giải pháp nơ ron là thiết kế một MNN, luyện mạng để nó xấp xỉ được hàm phi tuyến.

Quá trình xử lý số liệu được bắt đầu từ khâu xác định cấu trúc chung của MNN, sau đó là quá trình thiết kế mẫu và luyện mạng, kết thúc ở khâu xác định thông số tối ưu cho MNN. Trong đó, phần xác định số nơ ron lớp ẩn của MNN có ảnh hưởng lớn đến sai số.

Số nơ ron lớp ẩn của MNN càng lớn, năng lực của mạng càng lớn, năng lực học cũng càng lớn, khả năng quá trùng khớp càng cao. Để giảm khả năng quá trùng khớp, thường là giảm số nơ ron lớp ẩn. Điều này có nghĩa là: Mỗi thông số cấu trúc, chủ yếu là mỗi trọng số là một tham số làm tăng khả năng của mạng. Số trọng số quyết định các mức độ tự do mà mạng có thể khớp với dữ liệu. Do đó, để hạn chế mức tự do trên, cần giảm số trọng số, nghĩa là giới hạn số nơ ron lớp ẩn.

Cho tới nay, lý thuyết MNN chưa đưa ra được một công thức hay thuật toán chính xác nào để xác định số nơ ron lớp ẩn tối ưu cho mạng. Thủ tục xác định số nơ ron lớp ẩn cho mạng vẫn đang được dùng là: Chọn mạng với số nơ ron lớp ẩn khác nhau, qua quá trình luyện bằng tập mẫu luyện, kiểm tra sai số. Sai số nhỏ hơn có nghĩa là số nơ ron lớp ẩn kiểm tra đã tối ưu. Tuy nhiên, số nơ ron lớp ẩn ban đầu cần chọn để thử chưa có cách nào xác định.

Đối với mỗi trường hợp cụ thể, như cảm biến MQ135, với cấu trúc r-N-1, ta xác định được bài toán có một đầu vào là khí NH3 nên r = 1. Hơn nữa, đặc tính là một đường cong đơn trị, có vùng làm việc hữu hạn nên có điều kiện để dự kiến số nơ ron lớp ẩn không quá lớn.

Sau đây là một số kết quả khi luyện mạng với N nơ ron lớp ẩn khác nhau:

4
Hinh 2.11: Đặc tính thu được khi luyện mạng với N = 16

Với các giá trị N chọn lần lượt từ N = 10 ÷ 16 (tương ứng với các hình từ 5 - 10), ta nhận thấy sai số giảm dần khi N tăng từ N = 10 đến N = 13 và các điểm mẫu với các điểm luyện gần trùng nhau là dạng đường cong được xấp xỉ gần dạng với đường cong ban đầu và với N = 13 ta có kết quả “tốt” nhất. Như vậy, ta có thể kết luận thông số của mạng là tối ưu, thuật toán học được sử dụng hiệu quả và mạng MLP có độ phức tạp phù hợp, có khả năng xấp xỉ đặc tính mong muốn với độ chính xác cao, đặc biệt về dáng điệu của đặc tính.

Còn trường hợp N = 14 ÷ 16 thì các điểm này trùng khớp nhau hoàn toàn, tức là độ chính xác rất cao, nhưng đường cong được xấp xỉ thì có dáng điệu không đúng với dạng đường cong ban đầu. Tức là trong trường hợp này, mạng có khả năng học để xấp xỉ, nhưng sau khi được huấn luyện mặc dù xấp xỉ được chính xác những mẫu đã học nhưng MNN không có khả năng xấp xỉ những mẫu chưa được học. Hiện tượng này được gọi là học quá trùng khớp (overfitting). Đây là đặc thù của MNN, nó mất khả năng khái quát hóa.

Khi MNN học quá khớp thì lại không đạt được mục đích. Nội dung của quá trình học là bắt chước các mẫu thu thập được từ quá khứ, nhưng mục tiêu của học là lại có được khả năng phản xạ với các mẫu sẽ gặp trong tương lai. Mà khả năng gặp lại các mẫu đã gặp trong quá khứ không phải lúc nào cũng lớn. Đó là trường hợp với N = 15 và N = 16, với mô hình quá phức tạp, số nơ ron lớp ẩn quá lớn. Đường đặc tính đi qua tất cả các điểm cho trước với độ chính xác rất cao nhưng dáng điệu của đặc tính thì hoàn toàn không đúng, nhất là trong trường hợp N = 16.

3. KẾT LUẬN

Bài báo đã giải quyết được các vấn đề sau: Nghiên cứu cấu trúc MNN MLP với cấu trúc gồm 13 nơ ron lớp ẩn và 1 nơ ron lớp ra đã được thiết kế để xấp xỉ đặc tính đầu ra cho cảm biến MQ135. Với kết quả trên là cơ sở để xác định những khả năng ứng dụng MNN cho cảm biến đo lường thông minh, hứa hẹn những khả năng ứng dụng vào thực tế đo lường.

Tài liệu tham khảo

[1]. Bùi Công Cường, Nguyễn Doãn Phước (2003), Hệ mờ mạng nơ ron và ứng dụng,  NXB. KH&KT.

[2]. Cao Minh Quyền (2005), Thông minh hóa cảm biến đo lường trên cơ sở mạng nơ ron nhân tạo, Luận án Tiến sỹ.

[3].  Lê Văn Doanh và các tác giả (2004), Các bộ cảm biến trong đo lường và điều khiển, NXB. KH&KT.

[4]. Nguyễn Đình Thúc (2000), Mạng nơ ron và phương pháp ứng dụng, NXB. Giáo dục.

[5].  MQ135, datasheet.

[6].  Phạm Thượng Hàn và các tác giả (2003), Kỹ thuật đo lường các đại lượng vật lý, tập 1,2, NXB. Giáo dục.

[7]. Phạm Thượng Hàn và các tác giả (2005), Bù sai số hệ thống trên cơ sở ứng dụng mạng nơ ron nhân tạo, Báo cáo Khoa học tại Hội nghị Đo lường toàn quốc.

[8]. Phạm Thượng Hàn và các tác giả (2005), Bù sai số gây bởi các yếu tố ảnh hưởng trong cảm biến nơ ron, Báo cáo Khoa học tại Hội nghị Đo lường toàn quốc.

[9].  Phạm Thị Ngọc Yến và các tác giả (1999), Cơ sở Matlab và ứng dụng, NXB KH&KT.

[10]. Trần Hoài Linh (2014), Mạng nơ ron và ứng dụng trong xử lý tín hiệu, NXB. Bách khoa Hà Nội.

[11]. David M.Skapura (1996), Building Neural Networks, ACM Press.

[12]. Gerald L.Anderson, David M.Hadden (1999), The gas  Monitoring HandBook, New York.

[13]. Jacob Fraden, Handbook of Modern Sensors, Springer.

[14]. Tran Hoai Linh, Application Of Neural Network In Sensor Characteristic Linearization And Its Implementation In Artificial Nose.

[15]. Tran Hoai Linh, S. Osowski, K. Brudzewski (2000), Supervised fuzzy neural networks for gas measurements, XXIII KKTOiUE, pp. 561-566.

Ý kiến của bạn

Bình luận