Mô-đun nhận dạng giọng nói

Xin chào các bạn thân mến. Cuối cùng, tôi bắt đầu ghi lại bài học về cách làm việc với mô-đun giọng nói. Tôi thấy bạn thích sản phẩm tự chế của tôi có tính năng điều khiển bằng giọng nói và nhiều người đã bắt đầu tự hỏi khi nào bài học thực tế về cách làm việc với mô-đun điều khiển bằng giọng nói sẽ được tung ra.

Mô-đun nhận dạng giọng nói

Về ưu điểm của module nhận dạng này:

- Mô-đun này hoạt động tự động và có thể hoạt động mà không cần bộ điều khiển điều khiển bên ngoài, điều này rất quan trọng đối với những người nghiệp dư vô tuyến không quen với lập trình.

- Cùng với các mô hình khác, mô-đun này được so sánh thuận lợi về chức năng, giá cả và tính dễ quản lý và kết nối tương đối.

- Có khả năng nhận biết cao.

- Không cần điện thoại thông minh.

Và thế là đi thôi! Video này sẽ hướng tới chủ yếu những người mới bắt đầu, những người chưa quen với lập trình và giao diện, nói chung là những người nghiệp dư về radio thông thường. Trong video, tôi sẽ hiển thị mọi thứ từ “A” đến “Z”: chúng ta sẽ bắt đầu bằng việc cài đặt chương trình và kết nối và kết thúc bằng kết quả cụ thể về hoạt động tự chủ của mô-đun.

Dù sao thì hãy bắt đầu với kiến ​​thức lý thuyết để hiểu phép màu kỹ thuật này thực sự hoạt động như thế nào. Trước hết bạn cần biết một số đặc điểm của module nhận dạng giọng nói này:

Mức tiêu thụ hiện tại: không quá 40 mA, dòng điện không quan trọng, vì vậy chỉ cần tính đến nó. Điện áp nguồn là 5 V, chúng tôi sẽ cấp nguồn cho mô-đun cổng USB của máy tính trong quá trình lập trình và sau đó trong quá trình vận hành, bạn sẽ quyết định lấy nguồn từ đâu. Độ chính xác nhận dạng lệnh bằng giọng nói là 99% trong điều kiện lý tưởng. Mô-đun nhận dạng giọng nói phiên bản V3.1 có khả năng ghi nhớ 80 lệnh thoại! Theo tôi, điều đó là khá đủ cho bất kỳ mục đích nào. Nhưng một lần nữa đây là một "NHƯNG". Nhưng mô-đun chỉ có thể nhận dạng bảy lệnh bất kỳ trong một đơn vị thời gian và bạn có thể chọn lệnh nào.

Mô-đun nhận dạng giọng nói

Nghĩa là, bạn có thể ghi tất cả 80 lệnh vào cơ sở dữ liệu, nhưng chỉ chọn bảy lệnh để nhận dạng, bảy trong số tám mươi lệnh bất kỳ. Nó giống như với một chiếc máy tính: bạn có thể ghi 80 lệnh trên ổ cứng nhưng chỉ làm việc được với 7 lệnh trong RAM. Nếu bây giờ bạn thấy khó hiểu, thì một lát sau, khi thực hành, tôi nghĩ bạn sẽ hiểu rõ chúng ta đang nói về điều gì. Độ dài của lệnh thoại là giá trị tối đa 1,5 giây (1500ms). Bảng mô-đun có thể được điều khiển thông qua giao diện UART, nhưng thông tin có thể được lấy từ UART hoặc từ các cổng GPIO nằm trên bảng. Trên thực tế, đây là điều chúng tôi sẽ làm: chúng tôi sẽ loại bỏ tín hiệu khỏi đầu ra cổng.

Hãy chuyển sang phần thực tế.

Chúng ta cần gì cho công việc?

- Bản thân mô-đun nhận dạng giọng nói là phiên bản V3 (V3.1), phiên bản này không quá quan trọng - nguyên tắc hoạt động của tất cả đều giống nhau. Mô-đun đi kèm với một micrô.

- Hướng dẫn sử dụng mô-đun, tức là bảng ngày tháng.

- Chương trình đầu cuối.

- Bộ chuyển đổi giao diện USB-UART.

Mọi link mua và tải phần mềm đều có ở dưới video, ở cuối bài viết.

Đó là tất cả. Như Gagarin đã nói, "Đi thôi."

Tải xuống hướng dẫn và thiết bị đầu cuối. Chúng tôi cài đặt thiết bị đầu cuối.Chúng tôi kết nối mô-đun với bộ chuyển đổi giao diện.

Mô-đun nhận dạng giọng nói

Hãy hết sức cẩn thận khi kết nối. Không sao đâu, nếu bạn nhầm lẫn giữa TXD và RXD thì sẽ không có chuyện gì xấu xảy ra. Nhưng nếu nhầm lẫn dây nguồn với dây chung thì sẽ là thảm họa! Như đã xảy ra với tôi, mô-đun và cổng máy tính ngay lập tức bị cháy! Hãy thật cẩn thận và đừng lặp lại sai lầm của tôi. Đừng ồn ào, đừng vội vàng, hãy kiểm tra mạch nhiều lần trước khi bật và chỉ sau đó mới kết nối với USB.

Sau khi kết nối với USB, hệ thống của bạn sẽ bắt đầu tìm kiếm trình điều khiển cho bộ chuyển đổi, trong 90% trường hợp, hệ thống tự tìm trình điều khiển và cài đặt nó, nhưng nếu vì lý do nào đó điều này không xảy ra, thì bạn sẽ cần phải tìm trình điều khiển trên mạng và cài đặt nó. Để thực hiện việc này, hãy viết “tải xuống trình điều khiển CP2102” hoặc đại loại như thế vào thanh tìm kiếm, mô-đun này là phổ biến, có rất nhiều tùy chọn trình điều khiển.

Tiếp theo, sau khi cài đặt thiết bị thành công, hãy vào trình quản lý thiết bị và xem các cổng. Chúng tôi quan tâm đến số lượng được chỉ định của bộ chuyển đổi của chúng tôi. Khi tìm ra số cổng, chúng tôi khởi chạy thiết bị đầu cuối. Hãy vào phần cài đặt và đặt các giá trị như trong hình của tôi.

Chúng tôi viết lệnh trong cửa sổ terminal - “AA 02 00 0A” (từ biểu dữ liệu | AA | 02 | 00 | 0A |). Tất cả các đội luôn sử dụng chữ in hoa và chữ cái Latinh.

Trường gửi sẽ cung cấp cho bạn phản hồi như: “AA 08 00 STA BR IOM IOPW AL GRP 0A” (hoặc từ biểu dữ liệu | AA | 08 | 00 | STA | BR | IOM | IOPW | AL | GRP | 0A |). Nếu câu trả lời đến thì mọi chuyện đều ổn, công việc đã hoàn thành một nửa. Nếu không, chúng tôi sẽ thử cài đặt tốc độ truyền trong thiết bị đầu cuối, có thể mô-đun được định cấu hình cho tốc độ khác.

Tôi sẽ không tập trung vào ý nghĩa của phản hồi mô-đun này, bạn có thể tự tra cứu nó trong hướng dẫn.Và lệnh là yêu cầu cài đặt đã cài đặt.

Mô-đun nhận dạng giọng nói

Bây giờ bạn cần kết nối tải với mô-đun. Như một tải tôi sẽ sử dụng đèn LED với điện trở. Vâng, trong tương lai, khi sử dụng những thứ này đèn LED sẽ được thay thế bằng rơle điều khiển tải bằng công tắc bán dẫn, tôi nghĩ điều này cũng dễ hiểu.

Hãy để tôi giải thích chính lệnh đó “AA 02 00 0A" là một gói gồm 4 byte, byte là các ký tự được ghép nối theo hệ thập lục phân - AA,02,00,0A. Trong tất cả các lệnh, gói sẽ bắt đầu bằng byte A.A. và kết thúc bằng một byte 0MỘT (Không và MỘT) là điều kiện tiên quyết. Phản hồi của mô-đun cũng sẽ bắt đầu và kết thúc bằng các ký tự này.

«AA 02 00 0A" - byte thứ hai của lệnh này có nghĩa là số byte giữa byte bắt đầu và byte kết thúc, nói tóm lại là ngoại trừ A.A. 0A. Và chúng tôi đếm và ghi mọi thứ giữa chúng vào byte thứ hai. Như chúng ta thấy trong ví dụ này, cái gì nằm giữa A.A. 0A tốn hai byte - 02 00, do đó – 02, tức là số đó tự đếm. Một vi dụ khac, "AA 03 20 01 0A"tức là giữa A.A. 0A tốn ba byte - «03 20 01", do đó, byte thứ hai là 03. Tôi nghĩ bạn sẽ hiểu.

Đội "12" - thiết lập các cổng mô-đun.

Trên bo mạch mô-đun có các cổng mà chúng ta sẽ loại bỏ tín hiệu, trước khi thực hiện việc này, chúng ta cần cấu hình các cổng này. Bạn có thể cấu hình các cổng bằng lệnh

"AA 03 12 01 0A" - byte thứ ba là lệnh và byte thứ tư là giá trị lệnh. Byte thứ tư có thể lấy các giá trị sau và đặt các tùy chọn sau: nếu “00” là chế độ xung, nghĩa là khi nhận được lệnh thoại, một xung ngắn sẽ được gửi đến cổng chúng ta cần. Nếu “01” là chế độ đảo ngược, tức là khi nhận được lệnh thoại thì cổng chúng ta cần sẽ chuyển trạng thái sang ngược lại, nếu là 0 thì sẽ thành 1 và ngược lại.Nếu “02” là chế độ trong đó cổng chuyển về 0. Nếu “03” là chế độ mà cổng chuyển sang chế độ 1.

Đội "20" - thiết lập các cổng mô-đun.

"AA 03 20 01 0A" - byte thứ ba là số lệnh mà chúng ta sẽ viết. Ví dụ viết 2 lệnh 1 và 2: "AA 04 20 01 02 0A." Ví dụ viết 2 lệnh 1, 2, 3: "AA 05 20 01 02 03 0A."

Đội "30" - tải bản ghi vào "bộ nhận dạng" của mô-đun.

"AA 03 30 01 0A" - byte thứ ba là lệnh tải vào bộ nhớ của bộ nhận dạng bản ghi 01. Nếu bạn cần viết hai lệnh - "AA 04 30 01 02 0A", nếu bạn cần viết ra tất cả bảy lệnh - "AA 09 30 01 02 03 04 05 06 07 0A."

Đội "15" - Tự động tải lệnh thoại vào bộ nhận dạng khi bật nguồn - hoạt động ngoại tuyến mà không cần bộ điều khiển bên ngoài.

"AA 03 15 07 01 02 03 0A" - byte thứ ba là một lệnh, byte thứ tư là nhãn lệnh, nghĩa là một loại mã định danh và bằng 01 để tải một lệnh, 03 để tải hai lệnh, 07 để tải ba lệnh, v.v. xem bảng dữ liệu. Vâng, sau đó có những số lệnh cần được tải.

Đó là tất cả: chúng tôi đã kiểm tra kết nối với mô-đun, định cấu hình các cổng, ghi lệnh và định cấu hình tự động tải lệnh thoại.

Đọc về các lệnh khác trong biểu dữ liệu. Tôi vừa giải thích cách làm việc gần đúng với mô-đun.

 

 

Liên kết mua hàng:

Mô-đun –

Bộ chuyển đổi -

Bộ chuyển đổi có dây -

 

Liên kết tải xuống:

Ngày đã được ấn định –

Phần cuối -

Sau khi đọc bài viết, bạn đã hiểu cách làm việc với mô-đun giọng nói chưa?


Bình luận
  • cà vạtnụ cườicườiđỏ mặtcườithư giãn thoải máinhếch mép cười
    trái tim_mắthôn_timhôn_đóng_mắtđỏ bừngan tâmthỏa mãncười toe toét
    nháy mắtlè lưỡi nháy mắtbị mắc kẹt_out_tongue_closed_eyescười toe toéthôn nhaubị mắc kẹt_out_tongueđang ngủ
    lo lắngcau màyđau khổopen_mouthnhăn mặtbối rốiim lặng
    vô cảmkhông hài lòngmồ hôi_nụ cườimồ hôithất vọng_nhẹ nhõmmệt mỏithụ động
    thất vọngbối rốiđáng sợlạnh_mồ hôikiên trìkhócnức nở
    vui sướngkinh ngạcla hétkhuôn mặt mệt mỏitức giậncơn thịnh nộchiến thắng
    buồn ngủừmmặt nạkính râmmặt chóng mặtimpmỉm cười_imp
    mặt trung lậpkhông_miệngvô tội
3+ba=
Bình luận (4)
  1. Artyom
    #1 Artyom Khách Ngày 30 tháng 12 năm 2016 10:12
    1
    Xin chào. Bạn có thể mua bộ điều khiển giọng nói làm sẵn cho ngôi nhà thông minh không?
  2. Thiết bị tuyệt vời, tác giả thông minh.
    #2 Thiết bị tuyệt vời, tác giả thông minh. Khách Ngày 21 tháng 8 năm 2019 12:09
    1
    Tôi cũng muốn mua một thiết bị làm sẵn hoặc tôi đang chờ trợ giúp về cài đặt
    Trân trọng
    Bác Misha.
  3. maikl
    #3 maikl Khách Ngày 1 tháng 10 năm 2019 11:55
    1
    Ít, sâu sắc.Người viết nguệch ngoạc đầy tự tin.
    Không dạy được thì cũng đừng can thiệp, dịch lại datasheet là tốt hơn.
  4. Khách Nikolay
    #4 Khách Nikolay Khách Ngày 16 tháng 12 năm 2019 22:17
    0
    Ngày tốt. Có thể viết thư cho bạn được không? Về mô-đun giọng nói. Tôi muốn biết thêm về anh ấy.
    Nikolai