Khi cân nhắc giao cho máy việc ghi nháp hồ sơ trong buổi hỏi bệnh, câu hỏi đầu tiên của hầu hết bác sĩ lâm sàng không phải là "máy ghi nhanh không" mà là một trăn trở khác: nếu cả tôi, người bệnh và người nhà cùng nói, làm sao hệ thống không nhầm lời than phiền của người bệnh thành chỉ định của tôi? Đây là một câu hỏi đúng và cần được trả lời bằng cơ chế kỹ thuật, chứ không phải bằng lời hứa. Bài viết này mổ xẻ pipeline ba bước biến một buổi đối thoại hỏi bệnh nhiều người nói thành bản nháp bệnh án có cấu trúc: từ cách hệ thống nghe và tách lời theo vai trò, lọc phần bệnh sử cần lưu, đến cách dựng hồ sơ theo logic lâm sàng để bác sĩ phê duyệt. Kèm theo đó là điều kiện hoạt động và những giới hạn bạn cần biết trước khi tin dùng.
Vì sao ghi chép thủ công khi hỏi bệnh đang bào mòn thời gian khám của bác sĩ
Trong một buồng khám đông, bác sĩ thường vừa hỏi vừa cúi xuống gõ phím. Hệ quả là ánh mắt rời khỏi người bệnh, mất đi tín hiệu phi ngôn ngữ vốn rất giá trị trong thăm khám, và dễ sót những triệu chứng được kể thoáng qua.
Cách làm thay thế cũng không tối ưu hơn: nhiều bác sĩ chọn ghi nhớ rồi nhập lại sau giờ khám. Nhưng càng để lâu, chi tiết càng rơi rụng, dẫn tới hồ sơ thiếu chính xác theo kiểu tam sao thất bản.
Bài toán đặt ra là một hệ thống lắng nghe nền (ambient AI scribe) ghi lại đối thoại và tự dựng nháp bệnh án, trả lại cho bác sĩ khoảng thời gian vốn nên dành cho lâm sàng. Nói gọn, chuyển hội thoại hỏi bệnh thành bệnh án là quy trình hệ thống nghe buổi hỏi bệnh, phân tách lời người nói theo vai trò, lọc nội dung và dựng thành hồ sơ có cấu trúc để bác sĩ duyệt cuối.
Bước 1 - Nghe và phân tách người nói: tách lời bác sĩ khỏi lời người bệnh
Toàn bộ năng lực của một AI scribe nằm ở khả năng không chỉ "nghe được chữ" mà còn "biết ai nói chữ đó". Cơ chế này vận hành qua một chuỗi xử lý ba công đoạn nối tiếp nhau.
- Speech-to-Text chuyển toàn bộ lời nói trong buổi hỏi bệnh thành văn bản theo từng lượt thoại.
- Speaker diarization gán nhãn vai trò cho từng lượt nói, phân biệt bác sĩ, người bệnh và người nhà.
- AI lọc nội dung và dựng bản nháp bệnh án có cấu trúc từ phần văn bản đã được gán nhãn.
Pipeline ba bước biến buổi hỏi bệnh thành bản nháp bệnh án có cấu trúc
Speech-to-Text chuyển giọng nói thành văn bản theo lượt thoại
Lớp nhận dạng tiếng nói (speech-to-text, ASR) đảm nhiệm việc gỡ băng tự động: từng câu nói được chuyển thành văn bản gần như tức thời. Với bối cảnh y tế Việt Nam, lớp này phải xử lý được giọng vùng miền và đặc biệt là kho thuật ngữ y khoa, tên thuốc, đơn vị đo - vốn dễ bị nhận dạng sai nếu mô hình không được tối ưu cho ngành.
Đầu ra của bước này chưa phải là bệnh án, mà chỉ là một bản gỡ băng thô gồm nhiều lượt thoại đan xen. Việc làm cho bản thô đó "có nghĩa" thuộc về bước tiếp theo.
Speaker diarization - gán nhãn vai trò cho từng lượt nói
Speaker diarization là kỹ thuật trả lời hai câu hỏi: trong đoạn ghi âm có bao nhiêu người nói, và mỗi lượt thoại thuộc về ai. Hệ thống phân cụm các đặc trưng giọng nói, sau đó gán nhãn vai trò cho từng lượt: Bác sĩ, Người bệnh, Người nhà.
Đây chính là mắt xích then chốt giải tỏa trăn trở nêu ở đầu bài. Khi một câu như "tôi thấy đau tức ngực khi leo cầu thang" được gán đúng nhãn Người bệnh, nó sẽ được đưa vào phần bệnh sử chủ quan, chứ không bị hiểu nhầm thành nhận định hay y lệnh của bác sĩ. Ngược lại, câu "tôi cho chụp X-quang ngực thẳng" được gán nhãn Bác sĩ sẽ rơi vào phần hướng xử trí.
AI gán nhãn vai trò cho từng lượt thoại để tách đúng nguồn nội dung
Điều kiện để phân tách hoạt động tốt
Độ chính xác của việc gán nhãn vai trò phụ thuộc nhiều vào chất lượng âm thanh đầu vào. Để bước phân tách đạt hiệu quả cao, buổi hỏi bệnh nên đáp ứng các điều kiện sau:
- Số người nói vừa phải: lý tưởng trong khoảng 2-4 người để hệ thống phân cụm giọng rõ ràng.
- Âm thanh thu rõ: tránh thu ở khoảng cách quá xa khiến tín hiệu yếu, méo tiếng.
- Micro hướng đúng người nói: ưu tiên micro đặt gần trục hội thoại bác sĩ - người bệnh.
- Hạn chế nói chồng lời: khi nhiều người nói cùng lúc, việc tách lượt và gán nhãn dễ sai.
- Môi trường ít tiếng ồn nền: tiếng quạt, tiếng hành lang, tiếng thiết bị làm nhiễu đặc trưng giọng.
Bước 2 - Lọc nội dung và ẩn thông tin định danh nhạy cảm
Một buổi hỏi bệnh không chỉ có thông tin y khoa. Xen giữa đó là những câu hỏi thăm, lời tán gẫu, trao đổi thủ tục với bộ phận tiếp đón. Nếu bê nguyên bản gỡ băng vào hồ sơ, bệnh án sẽ ngập trong nhiễu.
Vì vậy, AI ở bước này thực hiện chắt lọc: giữ lại phần bệnh sử cần lưu như triệu chứng, thời điểm khởi phát, diễn tiến, tiền sử bệnh và thuốc đang dùng; đồng thời loại bỏ phần hội thoại không liên quan đến lâm sàng. Song song, hệ thống ẩn hoặc khử các thông tin định danh nhạy cảm không cần thiết cho nội dung chuyên môn, theo nguyên tắc tối thiểu hóa dữ liệu.
Lưu ý về pháp lý và bảo mật: Theo Luật Khám bệnh, chữa bệnh số 15/2023/QH15 (Điều 10), người bệnh có quyền được giữ bí mật thông tin trong hồ sơ bệnh án và các thông tin đời tư đã cung cấp, trừ trường hợp người bệnh đồng ý hoặc trường hợp luật định. Bản ghi và bản nháp do AI tạo ra chỉ là dữ liệu hỗ trợ; giá trị pháp lý chỉ thuộc về hồ sơ đã được bác sĩ rà soát, phê duyệt và ký xác nhận. Cơ sở cần áp dụng kiểm soát truy cập và mã hóa dữ liệu khi lưu trữ, liên thông.
Bước 3 - Dựng bản nháp bệnh án có cấu trúc để bác sĩ phê duyệt
Sau khi đã có nội dung sạch và gán đúng vai trò, AI sắp xếp thông tin vào một bố cục bệnh án quen thuộc thay vì để dưới dạng đoạn hội thoại tuần tự.
Bản nháp bệnh án được dựng theo cấu trúc SOAP để bác sĩ rà soát và phê duyệt
Sắp xếp theo logic SOAP / bệnh sử - khám - chẩn đoán
Cấu trúc phổ biến nhất là SOAP, ánh xạ gần như trực tiếp với cách bác sĩ vẫn tư duy khi làm bệnh án:
- Subjective (bệnh sử chủ quan): lời kể của người bệnh về triệu chứng, diễn tiến, tiền sử.
- Objective (khám): dấu hiệu sinh tồn, kết quả thăm khám và cận lâm sàng được ghi nhận.
- Assessment (đánh giá/chẩn đoán): nhận định và chẩn đoán hướng tới.
- Plan (hướng xử trí): chỉ định, đơn thuốc, hẹn tái khám và dặn dò.
Việc các lượt thoại đã được gán nhãn ở Bước 1 giúp AI điền đúng nội dung vào đúng mục: lời người bệnh chảy vào Subjective, y lệnh của bác sĩ chảy vào Plan.
Bác sĩ là người duyệt cuối - hệ thống chỉ tạo bản nháp
Cần khẳng định rõ ranh giới: sản phẩm của AI là bản nháp, không phải bệnh án chính thức. Bác sĩ rà soát từng mục, hiệu chỉnh chỗ máy hiểu sai, bổ sung phán đoán lâm sàng rồi mới ký xác nhận. AI không thay thế và không nên được kỳ vọng thay thế phán đoán của người thầy thuốc.
Ở bước đánh giá, năng lực AI hỗ trợ chẩn đoán lâm sàng (CDSS) có thể bổ trợ bằng cách gợi ý chẩn đoán phân biệt hay cảnh báo tương tác thuốc, nhưng quyết định cuối cùng vẫn là của bác sĩ.
Giới hạn cần biết trước khi tin dùng công cụ ghi bệnh án bằng giọng nói
Hiểu đúng giới hạn giúp triển khai thực tế tránh thất vọng. Có ba điểm cần ghi nhớ.
Thứ nhất, độ chính xác gán nhãn vai trò không tuyệt đối. Khi hai người có chất giọng gần giống nhau, hoặc môi trường ồn, hệ thống có thể gán sai lượt thoại, và đây chính là lý do bước duyệt của bác sĩ là bắt buộc chứ không phải tùy chọn.
Thứ hai, công cụ không phù hợp với mọi tình huống. Những ca có quá nhiều người nói chồng chéo, hội chẩn đông người hoặc khám trong môi trường cấp cứu ồn ào sẽ cho chất lượng phân tách kém. Với cách tiếp cận đọc - ghi tuần tự, bạn có thể tham khảo thêm về cách nhập bệnh án bằng giọng nói vốn ít phụ thuộc vào việc tách nhiều người nói.
Thứ ba, về vai trò pháp lý, bản ghi âm và bản nháp transcript chỉ là dữ liệu hỗ trợ. Giá trị pháp lý của hồ sơ thuộc về phần bác sĩ đã duyệt và ký, đúng theo nguyên tắc trách nhiệm chuyên môn không thể chuyển giao cho phần mềm.
MyHospital - hỏi bệnh bằng giọng nói tích hợp AI hỗ trợ chẩn đoán cho bệnh viện
Điểm khác biệt của MyHospital không dừng ở việc gỡ băng. Hệ thống kết hợp speech-to-text hỏi bệnh, phân tách người nói, AI dựng nháp bệnh án theo cấu trúc và CDSS hỗ trợ ở bước đánh giá, rồi liên thông thẳng kết quả đã duyệt vào bệnh án điện tử trong cùng nền tảng. Bác sĩ giữ trọn quyền kiểm soát: máy lo phần ghi nháp, người thầy thuốc lo phần phán đoán và phê duyệt.
Muốn xem cách buổi hỏi bệnh được chuyển thành nháp bệnh án có cấu trúc ngay trên màn hình khám? Trải nghiệm tính năng hỏi bệnh bằng giọng nói và AI hỗ trợ chẩn đoán trong nền tảng phần mềm quản lý bệnh viện MyHospital, và đánh giá trực tiếp trên dữ liệu của chính cơ sở bạn.