Root NationBài viếtCông nghệMạng lưới thần kinh là gì và chúng hoạt động như thế nào?

Mạng lưới thần kinh là gì và chúng hoạt động như thế nào?

-

Hôm nay chúng ta sẽ cố gắng tìm hiểu mạng lưới thần kinh là gì, cách chúng hoạt động và vai trò của chúng trong việc tạo ra trí tuệ nhân tạo.

Mạng lưới thần kinh. Chúng tôi nghe thấy cụm từ này hầu như ở khắp mọi nơi. Đến mức bạn sẽ tìm thấy mạng lưới thần kinh ngay cả trong tủ lạnh (đây không phải là một trò đùa). Mạng lưới thần kinh được sử dụng rộng rãi bởi các thuật toán học máy, ngày nay không chỉ có thể tìm thấy thuật toán này trong máy tính và điện thoại thông minh mà còn trong nhiều thiết bị điện tử khác, chẳng hạn như thiết bị gia dụng. Và bạn đã bao giờ tự hỏi những mạng lưới thần kinh này là gì chưa?

Đừng lo lắng, đây sẽ không phải là một bài giảng mang tính học thuật. Có nhiều ấn phẩm, bao gồm cả bằng tiếng Ukraina, giải thích vấn đề này một cách rất chuyên nghiệp và đáng tin cậy trong lĩnh vực khoa học chính xác. Những ấn phẩm như vậy đã hơn chục năm tuổi. Làm thế nào mà những ấn phẩm cũ này vẫn còn phù hợp? Thực tế là các nguyên tắc cơ bản của mạng nơ-ron không thay đổi và bản thân khái niệm này - một mô hình toán học của nơ-ron nhân tạo - đã được tạo ra trong Thế chiến thứ hai.

Mạng lưới thần kinh là gì và chúng hoạt động như thế nào?

Với Internet cũng vậy, Internet ngày nay tiên tiến hơn rất nhiều so với thời điểm email đầu tiên được gửi đi. Nền tảng của Internet, các giao thức cơ bản, đã tồn tại ngay từ khi nó mới được tạo ra. Mọi khái niệm phức tạp đều được xây dựng trên nền tảng của các cấu trúc cũ. Với bộ não của chúng ta cũng vậy, vỏ não trẻ nhất không thể hoạt động nếu không có yếu tố tiến hóa lâu đời nhất: thân não, vốn đã tồn tại trong đầu chúng ta từ rất lâu so với sự tồn tại của loài người trên hành tinh này.

Tôi có làm bạn bối rối một chút không? Vì vậy, hãy hiểu chi tiết hơn.

Cũng thú vị: ChatGPT: Hướng dẫn sử dụng đơn giản

Mạng lưới thần kinh là gì?

Mạng là một tập hợp các phần tử nhất định. Đây là cách tiếp cận đơn giản nhất trong toán học, vật lý hoặc công nghệ. Nếu mạng máy tính là một tập hợp các máy tính được kết nối với nhau thì mạng nơ-ron rõ ràng là một tập hợp các nơ-ron.

mạng lưới thần kinh

Tuy nhiên, những yếu tố này thậm chí còn không thể so sánh được về độ phức tạp với các tế bào thần kinh trong não và hệ thần kinh của chúng ta, nhưng ở một mức độ trừu tượng nhất định, một số đặc điểm của tế bào thần kinh nhân tạo và tế bào thần kinh sinh học là phổ biến. Nhưng cần phải nhớ rằng tế bào thần kinh nhân tạo là một khái niệm đơn giản hơn nhiều so với đối tác sinh học của nó, mà chúng ta vẫn chưa biết mọi thứ về nó.

- Quảng cáo -

Đọc thêm: 7 cách sử dụng tuyệt vời nhất của ChatGPT

Đầu tiên có một tế bào thần kinh nhân tạo

Mô hình toán học đầu tiên của tế bào thần kinh nhân tạo được phát triển vào năm 1943 (vâng, đó không phải là sai lầm, trong Thế chiến thứ hai) bởi hai nhà khoa học người Mỹ, Warren McCulloch và Walter Pitts. Họ đã làm được điều này trên cơ sở cách tiếp cận liên ngành, kết hợp kiến ​​thức cơ bản về sinh lý não bộ (hãy nhớ thời điểm mô hình này được tạo ra), toán học và cách tiếp cận CNTT còn non trẻ lúc bấy giờ (họ đã sử dụng, cùng với những thứ khác, lý thuyết về khả năng tính toán của Alan Turing ). Mô hình nơ-ron nhân tạo McCulloch-Pitts là một mô hình rất đơn giản, nó có nhiều đầu vào, trong đó thông tin đầu vào đi qua các trọng số (tham số), các giá trị xác định hành vi của nơ-ron. Kết quả thu được sẽ được gửi đến một đầu ra duy nhất (xem sơ đồ của nơ-ron McCulloch-Pitts).

mạng lưới thần kinh
Sơ đồ của một nơ-ron nhân tạo 1. Các nơ-ron có tín hiệu đầu ra là đầu vào của một nơ-ron nhất định 2. Bộ cộng tín hiệu đầu vào 3. Máy tính hàm truyền 4. Các nơ-ron đến đầu vào áp dụng tín hiệu của một nơ-ron nhất định 5. ωi - trọng số của tín hiệu đầu vào

Cấu trúc giống cây như vậy có liên quan đến tế bào thần kinh sinh học, bởi vì khi chúng ta nghĩ đến những bức vẽ mô tả các tế bào thần kinh sinh học, chúng ta nghĩ ngay đến cấu trúc giống cây đặc trưng của các sợi nhánh. Tuy nhiên, người ta không nên ảo tưởng rằng tế bào thần kinh nhân tạo ít nhất cũng gần giống với tế bào thần kinh thật. Hai nhà nghiên cứu này, tác giả của tế bào thần kinh nhân tạo đầu tiên, đã chứng minh được rằng bất kỳ hàm tính toán nào cũng có thể được tính toán bằng cách sử dụng mạng lưới các tế bào thần kinh được kết nối với nhau. Tuy nhiên, hãy nhớ rằng những khái niệm đầu tiên này chỉ được tạo ra dưới dạng những ý tưởng chỉ tồn tại "trên giấy" và không được diễn giải thực tế dưới dạng thiết bị vận hành.

Đọc thêm: Giới thiệu về máy tính lượng tử nói một cách đơn giản

Từ mô hình đến triển khai sáng tạo

McCulloch và Pitts đã phát triển một mô hình lý thuyết, nhưng việc tạo ra mạng lưới thần kinh thực sự đầu tiên phải đợi hơn mười năm. Người tạo ra nó được coi là một nhà tiên phong khác trong nghiên cứu trí tuệ nhân tạo, Frank Rosenblatt, người đã tạo ra mạng Mark I Perceptron vào năm 1957, và chính bạn đã chứng minh rằng nhờ cấu trúc này, cỗ máy đã có được một khả năng mà trước đây chỉ có ở động vật và con người: nó có thể học. Tuy nhiên, bây giờ chúng ta biết rằng trên thực tế, đã có những nhà khoa học khác đưa ra ý tưởng rằng một cỗ máy có thể học hỏi, kể cả trước Rosenblatt.

Mark I Perceptron

Nhiều nhà nghiên cứu và tiên phong về khoa học máy tính trong những năm 1950 đã nảy ra ý tưởng làm thế nào để một chiếc máy có thể làm được những việc mà nó không thể tự làm được. Ví dụ, Arthur Samuel đã phát triển một chương trình chơi cờ đam với con người, Allen Newell và Herbert Simon đã tạo ra một chương trình có thể chứng minh các định lý toán học một cách độc lập. Ngay cả trước khi mạng lưới thần kinh đầu tiên của Rosenblatt được tạo ra, hai nhà tiên phong nghiên cứu khác trong lĩnh vực trí tuệ nhân tạo là Marvin Minsky và Dean Edmonds, vào năm 1952, tức là ngay cả trước khi xuất hiện perceptron của Rosenblatt, đã chế tạo một cỗ máy có tên SNARC (Stochastic Neural Máy tính tăng cường tương tự) - tăng cường máy tính tương tự thần kinh ngẫu nhiên, được nhiều người coi là máy tính mạng thần kinh ngẫu nhiên đầu tiên. Cần lưu ý rằng SNARC không liên quan gì đến máy tính hiện đại.

SNARC

Cỗ máy mạnh mẽ, sử dụng hơn 3000 ống điện tử và cơ chế lái tự động dự phòng từ máy bay ném bom B-24, có thể mô phỏng hoạt động của 40 tế bào thần kinh, hóa ra đủ để mô phỏng về mặt toán học việc tìm kiếm lối ra khỏi mê cung của một con chuột. . Tất nhiên là không có chuột, đó chỉ là quá trình suy luận và tìm ra giải pháp tối ưu mà thôi. Chiếc xe này là một phần của luận án Tiến sĩ của Marvin Minsky.

mạng adaline

Một dự án thú vị khác trong lĩnh vực mạng lưới thần kinh là mạng ADALINE, được phát triển vào năm 1960 bởi Bernard Withrow. Vì vậy, người ta có thể đặt câu hỏi: từ hơn nửa thế kỷ trước, các nhà nghiên cứu đã biết nền tảng lý thuyết của mạng lưới thần kinh và thậm chí đã tạo ra những triển khai hoạt động đầu tiên của các khung tính toán như vậy, tại sao phải mất một thời gian dài như vậy, cho đến tận thế kỷ 21 mới có thể thực hiện được. tạo ra các giải pháp thực sự dựa trên mạng lưới thần kinh? Câu trả lời là một: sức mạnh tính toán không đủ, nhưng đó không phải là trở ngại duy nhất.

mạng lưới thần kinh

Mặc dù trong những năm 1950 và 1960, nhiều nhà tiên phong về AI đã bị mê hoặc bởi khả năng của mạng lưới thần kinh và một số người trong số họ dự đoán rằng chỉ mười năm nữa mới có một cỗ máy tương đương với bộ não con người. Điều này thậm chí còn buồn cười khi đọc ngày hôm nay, bởi vì chúng ta vẫn chưa tiến gần đến việc tạo ra một cỗ máy tương đương với bộ não con người và chúng ta vẫn còn lâu mới giải quyết được nhiệm vụ này. Rõ ràng là logic của các mạng lưới thần kinh đầu tiên vừa hấp dẫn vừa hạn chế. Việc triển khai AI đầu tiên sử dụng tế bào thần kinh nhân tạo và thuật toán học máy có thể giải quyết một phạm vi nhiệm vụ hẹp nhất định.

Tuy nhiên, khi nói đến không gian rộng hơn và giải quyết những vấn đề thực sự nghiêm trọng, chẳng hạn như nhận dạng mẫu và hình ảnh, dịch đồng thời, nhận dạng giọng nói và chữ viết tay, v.v., tức là những việc mà máy tính và AI đã có thể làm ngày nay, hóa ra là việc triển khai mạng nơ-ron đầu tiên đơn giản là không thể làm được điều đó. Tại sao cái này rất? Câu trả lời được đưa ra bởi nghiên cứu của Marvin Minsky (vâng, cùng một nghiên cứu của SNARC) và Seymour Papert, người vào năm 1969 đã chứng minh những hạn chế của logic perceptron và cho thấy rằng việc tăng khả năng của các mạng thần kinh đơn giản chỉ bằng cách mở rộng quy mô sẽ không hiệu quả. Còn một rào cản nữa nhưng rất quan trọng – sức mạnh tính toán hiện có vào thời điểm đó quá nhỏ để mạng lưới thần kinh có thể được sử dụng như dự kiến.

Cũng thú vị:

- Quảng cáo -

Sự phục hưng của mạng lưới thần kinh

Trong những năm 1970 và 1980, mạng lưới thần kinh thực tế đã bị lãng quên. Phải đến cuối thế kỷ trước, sức mạnh tính toán sẵn có mới trở nên lớn đến mức con người bắt đầu quay trở lại với nó và phát triển khả năng của mình trong lĩnh vực này. Sau đó, các chức năng và thuật toán mới xuất hiện, có thể khắc phục những hạn chế của mạng nơ-ron đơn giản đầu tiên. Khi đó, ý tưởng về deep machine learning của mạng lưới thần kinh đa lớp nảy sinh. Điều gì thực sự xảy ra với các lớp này? Ngày nay, hầu hết tất cả các mạng thần kinh hữu ích hoạt động trong môi trường của chúng ta đều có nhiều lớp. Chúng ta có một lớp đầu vào có nhiệm vụ nhận dữ liệu đầu vào và các tham số (trọng số). Số lượng các tham số này thay đổi tùy thuộc vào độ phức tạp của vấn đề tính toán được mạng giải quyết.

mạng lưới thần kinh

Ngoài ra, chúng ta còn có cái gọi là "lớp ẩn" - đây là nơi xảy ra tất cả những "điều kỳ diệu" liên quan đến học máy sâu. Chính các lớp ẩn chịu trách nhiệm về khả năng học hỏi và thực hiện các phép tính cần thiết của mạng lưới thần kinh này. Cuối cùng, phần tử cuối cùng là lớp đầu ra, tức là lớp mạng lưới thần kinh mang lại kết quả mong muốn, trong trường hợp này: chữ viết tay được nhận dạng, khuôn mặt, giọng nói, hình ảnh được tạo thành dựa trên mô tả văn bản, kết quả phân tích chụp cắt lớp của hình ảnh chẩn đoán và nhiều hơn nữa.

Đọc thêm: Tôi đã thử nghiệm và phỏng vấn chatbot của Bing

Mạng lưới thần kinh học như thế nào?

Như chúng ta đã biết, các nơ-ron riêng lẻ trong mạng nơ-ron xử lý thông tin với sự trợ giúp của các tham số (trọng số), được gán các giá trị và kết nối riêng lẻ. Các trọng số này thay đổi trong quá trình học, cho phép bạn điều chỉnh cấu trúc của mạng này theo cách tạo ra kết quả mong muốn. Mạng học chính xác như thế nào? Đó là điều hiển nhiên, nó phải được đào tạo liên tục. Đừng ngạc nhiên với câu nói này. Chúng ta cũng đang học, và có thể nói quá trình này không hỗn loạn mà có trật tự. Chúng tôi gọi đó là giáo dục. Trong mọi trường hợp, mạng lưới thần kinh cũng có thể được huấn luyện và điều này thường được thực hiện bằng cách sử dụng một bộ đầu vào được chọn phù hợp, bằng cách nào đó chuẩn bị cho mạng cho các nhiệm vụ mà nó sẽ thực hiện trong tương lai. Và tất cả những điều này được lặp lại từng bước, đôi khi quá trình học tập ở một mức độ nào đó giống với chính quá trình đào tạo.

Ví dụ: nếu nhiệm vụ của mạng nơ-ron này là nhận dạng khuôn mặt thì nó sẽ được huấn luyện trước trên một số lượng lớn hình ảnh có chứa khuôn mặt. Trong quá trình học, trọng số và tham số của các lớp ẩn sẽ thay đổi. Các chuyên gia sử dụng cụm từ "tối thiểu hóa hàm chi phí" ở đây. Hàm chi phí là một đại lượng cho chúng ta biết mạng lưới thần kinh nhất định mắc lỗi bao nhiêu. Chúng ta càng có thể giảm thiểu hàm chi phí do đào tạo thì mạng nơ-ron này sẽ hoạt động tốt hơn trong thế giới thực. Đặc điểm quan trọng nhất giúp phân biệt bất kỳ mạng thần kinh nào với một tác vụ được lập trình bằng thuật toán cổ điển là, trong trường hợp thuật toán cổ điển, người lập trình phải thiết kế từng bước những hành động mà chương trình sẽ thực hiện. Trong trường hợp mạng nơ-ron, bản thân mạng có khả năng tự học để thực hiện các nhiệm vụ một cách chính xác. Và không ai biết chính xác mạng lưới thần kinh phức tạp thực hiện các phép tính của nó như thế nào.

mạng lưới thần kinh

Ngày nay, mạng lưới thần kinh được sử dụng rộng rãi và có lẽ đáng ngạc nhiên là rất thường xuyên mà người ta không hiểu quá trình tính toán trong một mạng nhất định thực sự hoạt động như thế nào. Không cần thiết cho việc này. Các lập trình viên sử dụng các mạng thần kinh học máy được tạo sẵn, được chuẩn bị cho một loại dữ liệu đầu vào nhất định, xử lý chúng theo cách mà chỉ họ mới biết và tạo ra kết quả mong muốn. Một lập trình viên không cần biết quá trình suy luận hoạt động như thế nào bên trong mạng lưới thần kinh. Nghĩa là, một người vẫn tránh xa một khối lượng lớn các phép tính, một phương pháp thu thập thông tin và xử lý thông tin bằng mạng lưới thần kinh. Từ đó xuất hiện những lo ngại nhất định của nhân loại đối với các mô hình trí tuệ nhân tạo. Chúng ta chỉ sợ rằng một ngày nào đó mạng lưới thần kinh sẽ tự đặt ra cho mình một nhiệm vụ nhất định và tự mình tìm cách giải quyết nó mà không cần sự trợ giúp của con người. Điều này khiến nhân loại lo lắng, gây lo sợ và mất lòng tin vào việc sử dụng các thuật toán học máy.

trò chuyện gpt

Cách tiếp cận thực dụng này là phổ biến ngày nay. Với chúng tôi cũng vậy: chúng tôi biết cách đào tạo ai đó trong một hoạt động cụ thể và chúng tôi biết rằng quá trình đào tạo sẽ hiệu quả nếu nó được thực hiện đúng. Một người sẽ có được những kỹ năng mong muốn. Nhưng chúng ta có hiểu chính xác quá trình suy luận diễn ra trong não anh ta như thế nào gây ra hiệu ứng này không? Chúng tôi không biết.

Nhiệm vụ của các nhà khoa học là nghiên cứu những vấn đề này càng nhiều càng tốt để chúng phục vụ và giúp đỡ chúng ta khi cần thiết và quan trọng nhất là không trở thành mối đe dọa. Là con người, chúng ta sợ những gì chúng ta không biết.

Cũng thú vị: 

Yuri Svitlyk
Yuri Svitlyk
Con trai của dãy núi Carpathian, thiên tài toán học không được công nhận, "luật sư"Microsoft, người vị tha thực tế, trái-phải
- Quảng cáo -
Đăng ký
Thông báo về
khách sạn

0 Nhận xét
Bài đánh giá được nhúng
Xem tất cả các bình luận