Báo cáo Toàn diện về Hình học Riemannian: Khuôn khổ Toán học Tiên tiến trong Giải mã Tín hiệu Sóng não


1. Đặt vấn đề và Tầm quan trọng của Giao diện Không gian Não - Máy tính

Giao diện Não - Máy tính (Brain-Computer Interface - BCI) đại diện cho một trong những giới hạn đột phá nhất của khoa học thần kinh và kỹ thuật máy tính, mang đến khả năng kết nối trực tiếp hoạt động tư duy của con người với các hệ thống điện tử bên ngoài mà không cần thông qua các rào cản vật lý của hệ thần kinh ngoại biên hay cơ bắp.1 Các hệ thống này cung cấp những giải pháp mang tính cách mạng nhằm hỗ trợ giao tiếp cho những người bị tổn thương chức năng vận động nghiêm trọng, đồng thời mở ra những ứng dụng tiềm năng trong các lĩnh vực như theo dõi trạng thái nhận thức, điều khiển robot, phát hiện tiếng nói (speech detection), và nhận dạng trạng thái cảm xúc (emotion recognition).1

Phương thức đo lường phổ biến nhất trong các thiết kế BCI phi xâm lấn là Điện não đồ (Electroencephalography - EEG) và Từ não đồ (Magnetoencephalography - MEG).1 Mặc dù tính khả dụng và sự an toàn của EEG là không thể phủ nhận, loại tín hiệu này mang trong mình những thách thức cố hữu về mặt lý thuyết xử lý tín hiệu. Cụ thể, tín hiệu EEG được đặc trưng bởi tỷ lệ tín hiệu trên nhiễu (Signal-to-Noise Ratio - SNR) cực kỳ thấp, biên độ tín hiệu yếu, tính phi tuyến mạnh mẽ và đặc biệt là đặc tính phi dừng (non-stationary) theo không gian và thời gian.4 Hơn nữa, sự khác biệt về mặt giải phẫu và tâm lý học giữa các cá nhân tạo ra sự đa dạng lớn về phân bố dữ liệu (inter-subject variability). Ngay cả đối với cùng một người dùng, tín hiệu não cũng thay đổi một cách khó lường giữa các thời điểm ghi nhận khác nhau (cross-session variability) do sự biến thiên của mức độ tập trung, sự mệt mỏi, độ ẩm trên bề mặt da đầu, và các thay đổi về trở kháng điện cực.4

Trong nhiều thập kỷ qua, các mô hình học máy truyền thống phục vụ công tác giải mã BCI phần lớn dựa vào kỹ thuật lọc không gian phẳng như Common Spatial Patterns (CSP) hoặc các phiên bản điều chuẩn (Regularized CSP), kết hợp với việc trích xuất đặc trưng hình học Euclidean.8 Dù gặt hái được một số thành tựu nhất định trong điều kiện phòng thí nghiệm được kiểm soát nghiêm ngặt, các kỹ thuật Euclidean nhanh chóng bộc lộ những điểm yếu chí mạng khi đối mặt với lượng dữ liệu nhiễu cao của thế giới thực. Các phương pháp Euclidean thường giả định dữ liệu phân bố trong một không gian vector phẳng, dẫn đến độ nhạy cực cao với nhiễu ngoại lai, sự thiếu khả năng bao quát được mối tương quan chéo giữa các kênh điện cực, và nguy cơ rơi vào hiện tượng quá khớp (overfitting) trong quá trình hiệu chuẩn.1 Để đạt được mức hiệu năng chấp nhận được, các mô hình cổ điển yêu cầu quá trình hiệu chuẩn (calibration) tốn kém và mệt mỏi, khiến hệ thống BCI trở nên thiếu thân thiện với người sử dụng thực tế.9

Sự ra đời và tích hợp của khuôn khổ Hình học Riemannian (Riemannian Geometry) vào BCI đã kích hoạt một bước ngoặt mô hình thực sự.1 Thay vì nỗ lực biểu diễn các tín hiệu não một chiều mỏng manh trong không gian Euclidean, các nhà nghiên cứu chuyển hướng sang việc xử lý tín hiệu dưới dạng các ma trận hiệp phương sai đa chiều (covariance matrices).1 Khung toán học Riemannian nắm bắt được thực tế rằng tập hợp các ma trận hiệp phương sai đối xứng xác định dương (Symmetric Positive Definite - SPD) không hình thành một không gian vector tuyến tính, mà tạo thành một đa tạp vi phân (differentiable manifold) có độ cong âm.13 Bằng cách thực hiện các tính toán trực tiếp trên bề mặt đa tạp cong này, hình học Riemannian cung cấp sự bất biến (invariance) đối với các phép biến đổi affine, khả năng kháng nhiễu vượt trội, tối giản hóa việc trích xuất đặc trưng, và gia tăng đáng kể khả năng học chuyển giao (transfer learning).3 Những thành tựu thực tiễn của khuôn khổ này đã được minh chứng không thể tranh cãi qua việc liên tục giành chiến thắng trong nhiều cuộc thi phân tích dữ liệu BCI quốc tế danh giá trong những năm gần đây.11

2. Đặc tính Toán học Cơ bản của Đa tạp Ma trận Hiệp phương sai SPD

2.1 Định dạng và Điều kiện Cần của Ma trận Hiệp phương sai

Trong hệ sinh thái xử lý tín hiệu EEG hoặc MEG, một bản ghi tín hiệu cụ thể trong một cửa sổ thời gian (trial) thường được biểu diễn dưới dạng một ma trận , trong đó là số lượng kênh thu nhận (số điện cực) và là số lượng điểm dữ liệu rời rạc thu được theo thời gian (số mẫu).9 Quá trình xử lý sơ bộ thông thường yêu cầu dữ liệu phải được chuẩn hóa về mức 0 (zero-centered) thông qua việc trừ đi giá trị trung bình trên từng kênh.13

Ma trận hiệp phương sai mẫu (sample covariance matrix - SCM) đại diện cho mối tương quan tuyến tính về không gian giữa các điện cực được tính toán theo công thức ước lượng chuẩn:

 

Dựa vào công thức này, ta có thể dễ dàng chứng minh bằng đại số tuyến tính rằng ma trận hiệp phương sai là một ma trận đối xứng (tức là ) và có kích thước .13 Tuy nhiên, một đặc tính quan trọng và nghiêm ngặt hơn nhiều là ma trận này cần phải thỏa mãn điều kiện "xác định dương" (positive definite). Một ma trận đối xứng được coi là xác định dương nếu và chỉ nếu, đối với bất kỳ một vector khác không nào (), dạng toàn phương của nó luôn mang giá trị lớn hơn 0.13 Điều này có thể được chứng minh qua chuỗi phân tích sau:

 

Giá trị luôn lớn hơn 0 xuất phát từ giả định tiên quyết rằng bản ghi dữ liệu có hạng đủ (full rank).13 Hệ quả tất yếu là các ma trận hiệp phương sai cư trú một cách tự nhiên trong tập hợp các ma trận đối xứng xác định dương, được ký hiệu là hoặc hay ngắn gọn là nhóm SPD.4 Dựa trên nguyên lý phân tích nhân tử Cholesky (Cholesky factorization), không gian của tập hợp SPD được chứng minh là hoàn toàn tương đương với không gian của các ma trận hiệp phương sai hợp lệ.13

2.2 Sự Phá vỡ của Không gian Euclidean và Khoảng cách Riemannian Bất biến Affine (AIRM)

Một lỗi hệ thống thường gặp trong quá khứ là việc đánh giá khoảng cách giữa hai trạng thái não bộ (tức là hai ma trận hiệp phương sai) bằng các phép đo Euclidean truyền thống, điển hình như chuẩn Frobenius của sự khác biệt giữa hai ma trận.16 Nhược điểm của chuẩn Euclidean là nó coi như một không gian phẳng, vô tình cho phép các phép toán ngoại suy tạo ra những ma trận nằm ngoài tập hợp xác định dương (ví dụ, tạo ra ma trận có trị riêng âm).13 Các ma trận mang trị riêng âm hoàn toàn không có ý nghĩa vật lý trong tín hiệu điện não. Để đảm bảo sự vẹn toàn của cấu trúc, đa tạp trơn của các ma trận SPD phải được trang bị một metric (khoảng cách) Riemannian chuyên biệt.13

Metric kinh điển nhất và phổ biến nhất được sử dụng trong lĩnh vực này là Metric Riemannian Bất biến Affine (Affine-Invariant Riemannian Metric - AIRM), đôi khi còn được gọi là Fisher-Rao metric.8 Khoảng cách Riemannian giữa hai ma trận hiệp phương sai trên đa tạp được định nghĩa là chiều dài của đường cong trắc địa (geodesic) ngắn nhất nối hai điểm đó trên bề mặt cong, được biểu diễn bằng công thức giải tích sau:

 

Trong biểu thức này, đại diện cho các trị riêng thực (real eigenvalues) của ma trận tích (hoặc tương đương là của biểu thức ), là toán tử logarithm ma trận, và là chuẩn Frobenius.12 Toán tử logarithm ma trận của một ma trận SPD được tính toán thông qua quá trình phân tích trị riêng (eigenvalue decomposition), trong đó hàm số logarithm tự nhiên được áp dụng trực tiếp lên từng trị riêng của nó trên đường chéo chính.12

Đặc tính làm nên tên tuổi của AIRM chính là khả năng "bất biến đối với các phép biến đổi affine" (affine-invariance). Điều này có nghĩa là mọi phép nhân ma trận đối với một ma trận khả nghịch nào đó đều không làm thay đổi khoảng cách giữa hai ma trận gốc: .3 Trong ngữ cảnh vật lý thần kinh, phép biến đổi tương đương với các thao tác lọc nhiễu không gian, sự biến thiên về trở kháng tiếp xúc của lưới điện cực, hoặc hiện tượng dẫn truyền thể tích (volume conduction) lan truyền tín hiệu dưới da đầu. Do vậy, một hệ thống giải mã dựa trên AIRM có khả năng kháng lại sự nhiễu loạn của tín hiệu phần cứng và giữ được tính ổn định ưu việt so với không gian phẳng.3 Sự so sánh hiển nhiên nhất được ghi nhận trong bài toán nhận diện cảm xúc (SEED-V dataset) và trạng thái tâm trí, nơi các chuẩn Euclidean thất bại hoàn toàn trong việc tách biệt các cụm trạng thái, trong khi AIRM cung cấp ranh giới phân tách sắc nét.3

2.3 Hệ quy chiếu Khoảng cách Thay thế: Log-Euclidean Metric (LEM) và Wasserstein Metric

Mặc dù AIRM cung cấp các công cụ toán học vững chắc, nó không phải là "viên đạn bạc" duy nhất. Sự phức tạp trong tính toán của AIRM nảy sinh từ việc phải liên tục đảo ngược ma trận và tìm các trị riêng, điều này tạo ra gánh nặng bộ nhớ và làm chậm tiến trình học máy.4

Vì vậy, Metric Log-Euclidean (LEM) đã vươn lên như một hệ quy chiếu xuất sắc để thay thế AIRM trong các tác vụ thời gian thực hoặc cần học chuyển giao khối lượng lớn.4 LEM được định nghĩa dựa trên cấu trúc toán học của nhóm Lie. Dưới không gian này, đa tạp SPD được trang bị một phép toán nhóm đặc trưng:

 

với là hàm số mũ ma trận (được khai triển qua chuỗi Taylor: ) và là hàm logarithm ma trận.4 Bằng cách này, đa tạp Riemannian có thể được trải phẳng sang một không gian Euclidean nhưng hoạt động hoàn toàn trên miền logarithm của các ma trận SPD. Khoảng cách giữa hai điểm khi này được đơn giản hóa đến mức tối đa:

 

Hệ quả là, LEM bảo lưu được hầu hết các tính chất ưu việt của hình học cong (bao gồm cả tính bất biến nghịch đảo, bất biến nhân tỷ lệ) nhưng giảm thiểu hoàn toàn chi phí tính toán do không cần đến ma trận nghịch đảo.4 Tuy nhiên, LEM sẽ ưu tiên sự sai biệt giữa các trị riêng của ma trận thay vì nhấn mạnh vào hình dáng tổng thể (shape) và góc định hướng (orientation) của ma trận như AIRM.4

Ngoài ra, trong các kịch bản thực tế, quá trình áp dụng các phương pháp lọc nhiễu trước khi tạo ma trận hiệp phương sai thường xuyên triệt tiêu một số thành phần tín hiệu, khiến cho ma trận bị thiếu hạng (rank-deficient). Khi ma trận bị thiếu hạng, nó không còn thuộc tập SPD chặt chẽ nữa (định thức bằng không, trị riêng bằng không) và các tính toán logarithm theo chuẩn AIRM hay LEM sẽ bị phá vỡ.10 Để giải quyết rào cản này, người ta sử dụng metric Wasserstein (Wasserstein distance), một phép đo dựa trên lý thuyết vận chuyển tối ưu (Optimal Transport). Metric Wasserstein không yêu cầu ma trận phải có hạng đủ và không cần lấy nghịch đảo, cho phép nó đánh giá độ tương đồng ngay cả trên các dữ liệu EEG đã qua nhiều vòng lọc cực đoan.10 Tuy vậy, điểm yếu của Wasserstein là nó từ bỏ tính bất biến affine, đòi hỏi các tín hiệu phải được căn chỉnh trong một không gian phụ không gian chung trước khi phân tích.10

3. Tối ưu hóa Trọng tâm trên Đa tạp Riemannian (Karcher Mean)

Trong không gian Euclidean phẳng, giá trị trung bình đại diện cho một tập dữ liệu chỉ đơn giản là trung bình cộng số học. Tuy nhiên, nếu chúng ta tính trung bình cộng của các ma trận SPD, kết quả sẽ bị phình to (swelling effect), làm tăng độ nhiễu và bóp méo thông tin hình học của tín hiệu não.12

Khái niệm này trên đa tạp Riemannian được thay thế bằng trung bình Fréchet, hay thường được gọi là trung bình Karcher (Karcher mean). Trọng tâm hình học của một tập hợp gồm ma trận hiệp phương sai được định nghĩa là điểm nằm trên đa tạp sao cho nó cực tiểu hóa hàm mục tiêu là tổng bình phương khoảng cách Riemannian đến tất cả các ma trận thành phần 12:

 

Dưới metric Log-Euclidean (LEM), bài toán này vô cùng tuyệt vời vì nó có một nghiệm dạng đóng (closed-form solution) có thể giải quyết nhanh chóng bằng trung bình cộng trong miền logarithm.4 Tuy nhiên, dưới metric kinh điển AIRM, hàm mục tiêu này mang tính phi tuyến tính cao và không tồn tại phương trình giải tích có nghiệm tức thì. Các hệ thống máy tính BCI bắt buộc phải áp dụng các thuật toán tối ưu hóa lặp lại để xấp xỉ nghiệm của trung bình Karcher.4

3.1 Thuật toán Gradient Descent trên Riemannian

Phương pháp truyền thống nhất là thuật toán Weiszfeld được nâng cấp cho đa tạp, sử dụng cơ chế dốc xuống gradient (gradient descent).19 Thuật toán bắt đầu bằng cách khởi tạo một ma trận dự đoán (thường là trung bình số học), sau đó cập nhật điểm này dọc theo các hướng tiếp tuyến về phía trọng tâm thực sự.20 Công thức cập nhật lặp lùi (iterative update) được biểu diễn chi tiết như sau:

 

Quá trình này dịch chuyển điểm sang vị trí mới trên bề mặt đa tạp. Quá trình lặp sẽ chấm dứt khi khoảng cách giữa hai bước cập nhật liên tiếp trở nên nhỏ hơn một ngưỡng hội tụ mong muốn.5 Sự phức tạp về mặt thời gian (Time complexity) của quá trình lặp này với metric AIRM là (trong đó là số vòng lặp, là số lượng thử nghiệm, và là số kênh điện cực), trong khi với LEM, quá trình này chỉ tiêu tốn thời gian do có nghiệm xác định.4

3.2 Thuật toán L-RBFGS trên Đa tạp Riemannian

Đối với những bộ dữ liệu cực kỳ khổng lồ, kỹ thuật gradient descent cơ bản hội tụ quá chậm. Khắc phục điều này, các khung toán học tối ưu đã vận dụng thuật toán L-RBFGS (Limited-memory Broyden–Fletcher–Goldfarb–Shanno) phiên bản Riemannian.21 Thuật toán L-RBFGS cập nhật ma trận xấp xỉ Hessian (mô tả độ cong bậc hai của hàm mục tiêu) để điều hướng các bước nhảy nhanh hơn mà không cần tính toán trực tiếp đạo hàm bậc hai.21

Quy trình cập nhật một ma trận sang trên đa tạp M được xác định thông qua phép co rút (retraction) :

 

với là kích thước bước nhảy (stepsize) thường được tối ưu qua phương pháp tìm kiếm đường phi đơn điệu (nonmonotone line search) như điều kiện Armijo, và là hướng tìm kiếm dựa trên vector tiếp tuyến.21 Để thực hiện thuật toán này, toàn bộ các vector gradients từ các không gian tiếp tuyến ở các vòng lặp trước phải được dịch chuyển song song (parallel translation hoặc vector transport) về không gian tiếp tuyến hiện tại.21 Tuy nhiên, do phép tịnh tiến song song trên không gian SPD đòi hỏi hàm mũ ma trận rất đắt đỏ, các phương pháp vận chuyển vector thu gọn thường được thiết kế để cân bằng giữa hiệu suất xử lý và tính chính xác hình học.23 Việc chứng minh tính hội tụ toàn cục của các phương pháp tối ưu này cung cấp một bảo chứng lý thuyết vững chắc cho sự ổn định của hệ thống BCI khi tìm kiếm trọng tâm tập dữ liệu huấn luyện.22

4. Trải phẳng Hình học: Phép chiếu Không gian Tiếp tuyến và Đặc trưng hóa

Cho dù hình học Riemannian cung cấp một đa tạp rất trơn và hữu dụng, phần lớn kho tàng các thuật toán máy học phân loại tiên tiến hiện tại—bao gồm Máy Vector Hỗ trợ (Support Vector Machine - SVM), Hồi quy Logistic (Logistic Regression), các phân tích biệt thức (LDA), hay thậm chí các mạng nơ-ron học sâu phẳng—chỉ hoạt động chính xác trên các không gian vector tĩnh tuân theo hệ quy chiếu Euclidean.10 Do đó, việc xây dựng một cầu nối có khả năng chuyển đổi các điểm dữ liệu từ bề mặt cong của đa tạp sang một không gian phẳng, với mức độ bóp méo hình học (geometric distortion) thấp nhất có thể, là nhiệm vụ bắt buộc.

Cơ chế này được hiện thực hóa qua không gian tiếp tuyến (Tangent Space).10

4.1 Ánh xạ Logarithm (Logarithmic Map) và Ánh xạ Mũ (Exponential Map)

Bề mặt đa tạp của các ma trận SPD có thể được tưởng tượng như bề mặt của một quả cầu hoặc một mặt cong hypebol. Tại bất kỳ một điểm tham chiếu nào trên bề mặt này, chúng ta có thể đặt một mặt phẳng tiếp tuyến (tangent plane) chạm vào đa tạp tại duy nhất điểm đó.13 Mặt phẳng này tạo ra một không gian vector cục bộ, gọi là không gian tiếp tuyến .13

Để tối thiểu hóa sự biến dạng khi chiếu, điểm tham chiếu tiếp xúc thường không được chọn ngẫu nhiên mà luôn luôn được chỉ định là Trung bình Karcher của tập dữ liệu huấn luyện.5

Phép toán để ánh xạ các ma trận hiệp phương sai từ đa tạp lên mặt phẳng tiếp tuyến được thực hiện qua hàm Logarithmic map, định nghĩa bởi công thức 12:

 

Kết quả thu được, , là các ma trận đại diện cho không gian tiếp tuyến Euclidean. Ngược lại, trong những ứng dụng sinh dữ liệu giả hoặc nội suy (ví dụ như tạo ra các mẫu huấn luyện mới giữa hai ma trận có sẵn), ta có thể đẩy một điểm từ không gian tiếp tuyến ngược trở lại mặt cong thông qua hàm nghịch đảo là Exponential map 18:

 

Phép chiếu thuận và nghịch này đảm bảo sự đồng cấu và cho phép kỹ sư tín hiệu tiến hành các phép nội suy tuyến tính, lọc trung bình (averaging) ngay trên không gian tiếp tuyến một cách dễ dàng, trước khi chiếu kết quả về lại đa tạp gốc.5

4.2 Vector hóa nửa ma trận (Half-Vectorization) để huấn luyện mô hình

Các phần tử tại không gian tiếp tuyến là những ma trận đối xứng, do đó các thông tin chứa trong nửa ma trận tam giác dưới là lặp lại hoàn toàn so với nửa tam giác trên.12 Để chuyển hóa các ma trận này thành các chuỗi vector đặc trưng (feature vectors) cung cấp cho các bộ phân loại SVM hay Logistic Regression, quá trình vector hóa nửa ma trận (half-vectorization hay toán tử vech) được thực hiện.12

Vector đặc trưng được tính toán như sau 12:

 

Điều cần lưu ý là quá trình này không chỉ là cắt gọt đơn thuần. Để đảm bảo rằng không gian vector phản ánh chính xác các thuộc tính đo lường khoảng cách của ma trận tiếp tuyến (cụ thể là bảo tồn hoàn toàn chuẩn Frobenius sao cho ), các phần tử nằm ngoài đường chéo chính (off-diagonal elements) phải được nhân thêm với trọng số căn bậc hai của 2 ().12

Chỉ sau bước hiệu chuẩn trọng số này, vector mới mang chiều dài .12 Ví dụ, với hệ thống BCI gồm 16 kênh điện cực, số chiều của không gian đặc trưng tiếp tuyến sẽ là . Lúc này, mỗi tín hiệu sóng não một chiều và nhiễu loạn ban đầu đã được chuyển thể hoàn thiện thành một điểm dữ liệu tĩnh, rắn chắc với 136 chiều không gian tọa độ. Các mô hình LR hoặc linear SVM sẽ đào tạo để vẽ ra các siêu phẳng (hyperplanes) phân chia các lớp lệnh suy nghĩ (như tay phải, tay trái) một cách dễ dàng và hiệu quả vượt bậc.12

5. Ma trận Hiệp phương sai Tăng cường: Chinh phục Miền Thời gian - Tần số

Ma trận hiệp phương sai mẫu hoạt động một cách xuất chúng trong các cơ chế BCI thuộc nhóm Tưởng tượng Vận động (Motor Imagery - MI). Lý do là vì giao thức MI phụ thuộc vào sự Đồng bộ và Giải đồng bộ Liên quan đến Sự kiện (ERD/ERS) diễn ra tại vỏ não vận động, nơi thông tin chủ chốt nằm ở sự phân bố không gian (spatial distribution) của công suất điện não.30

Ngược lại, đối với những giao thức BCI như Điện thế Liên quan Sự kiện (Event-Related Potentials - ERP, ví dụ hiện tượng P300) hoặc Điện thế kích thích thị giác trạng thái ổn định (SSVEP), yếu tố cốt lõi mang thông tin giải mã lại nằm ở miền thời gian (sự thay đổi biên độ theo độ trễ millisecond) và miền tần số (biến thiên theo các tần số kích thích khác nhau của đèn nháy).30 Một ma trận hiệp phương sai cơ bản hoàn toàn phá hủy trật tự thời gian của tín hiệu, làm mất sạch manh mối để nhận diện ERP/SSVEP.30

Nhằm lấp đầy khoảng trống kỹ thuật này, các chuyên gia như Alexandre Barachant và Marco Congedo đã phát minh ra kỹ thuật Ma trận Hiệp phương sai Tăng cường (Augmented Covariance Matrix).32 Cơ sở toán học của nó vay mượn từ định lý nhúng trễ Takens (Takens' delay embedding theorem) dùng cho hệ thống động lực học phi tuyến, chỉ ra rằng cấu trúc quỹ đạo không gian pha (phase-space trajectory) của một chuỗi thời gian có thể được tái cấu trúc hoàn toàn bằng cách sử dụng chính nó lồng ghép cùng với các phiên bản trễ thời gian (delayed versions) của nó.32

Đối với dữ liệu BCI, hệ thống sử dụng một mô hình tự hồi quy (autoregressive model), giải phương trình Yule-Walker để chứng minh sự hình thành của một ma trận xác định dương mở rộng.33 Cụ thể, thay vì chỉ sử dụng , người ta tạo ra một khối ma trận mẫu phản hồi (template response) tương ứng với các kích thích mục tiêu (ví dụ: mẫu nháy đèn cho SSVEP hoặc hình ảnh mục tiêu cho P300).36 Tập dữ liệu thử nghiệm mở rộng (extended trial) sẽ bao gồm ma trận mẫu ghép nối chặt chẽ theo chiều dọc với tín hiệu thu nhận được 36:

 

Kết quả, quá trình tính toán tạo ra một Ma trận Hiệp phương sai Tăng cường có chiều không gian phình to gấp đôi ().37 Cấu trúc của khối ma trận mới này cực kỳ sâu sắc: trong khi các khối dọc đường chéo chính chứa thông tin không gian nội tại, thì khối góc tư phía trên bên phải (upper right block) của ma trận chứa chính xác phần tử mã hóa thông tin tương quan chéo giữa tín hiệu EEG thực tế và hình mẫu mục tiêu theo trục thời gian.38 Nghĩa là, toàn bộ động lực học thời gian và tính phi tuyến của ERP đã bị "đóng băng" và mã hóa thành thông tin không gian tĩnh.30 Nhờ vậy, hình học Riemannian chính thức bao phủ được mọi dạng dữ liệu BCI.33

Một lưu ý trong kỹ thuật là do việc thao tác xếp chồng mẫu có thể gây ra hiện tượng suy biến hạng ma trận, các nhà nghiên cứu thường áp dụng kỹ thuật điều chuẩn Tikhonov bằng cách cộng một hằng số nhỏ (hoặc ) lên dọc đường chéo chính, kết hợp với ma trận đơn vị : , đảm bảo tính xác định dương tuyệt đối.20 Phương pháp này đặc biệt xuất sắc nhưng cực kỳ nhạy cảm với hiện tượng trượt trễ (latency jitter), vì chỉ cần đỉnh sóng P300 trượt lệch 60 ms, cấu trúc tương quan chéo có thể bị sụp đổ.31

6. Tổng hợp Các Thuật toán Phân loại trên Riemannian

Kiến trúc phân loại giải mã trên đa tạp Riemannian phân nhánh thành hai trường phái rõ rệt: phân loại trực tiếp trên bề mặt cong của đa tạp và phân loại tại không gian phẳng sau phép chiếu tiếp tuyến.14

Bảng 1: Bảng Phân tích và So sánh các Thuật toán Phân loại Riemannian trong BCI 12

 

Thuật toán Phân loại

Môi trường Hoạt động

Cơ chế Quyết định (Decision Mechanism)

Lợi thế Đặc trưng

Nhược điểm & Hạn chế

MDM (Khoảng cách Tối thiểu đến Trung bình)

Trực tiếp trên đa tạp cong

Huấn luyện: Tính trung bình Karcher cho mỗi lớp . Đánh giá: Tìm lớp có khoảng cách geodesic Riemannian nhỏ nhất đến mẫu thử.

Thuật toán tĩnh hoàn toàn (deterministic). Không có siêu tham số (hyperparameter-free). Rất nhanh, ổn định và kháng nhiễu cực tốt.14

Chỉ cung cấp 1 ranh giới đơn giản. Có thể kém chính xác nếu phân bố của lớp dữ liệu bị kéo dài, phức tạp hoặc phi tuyến mạnh.14

Riemannian Means Field (MF)

Trực tiếp trên đa tạp cong

Thay vì 1 trung bình, tạo ra một "trường" chứa nhiều trung bình đa thức (power means) với tham số . Tính vector khoảng cách đến toàn bộ trường trung bình này, đưa vào Linear Discriminant Analysis (LDA).14

Giải quyết rào cản phân bố dữ liệu phi tuyến. Duy trì đặc tính hyperparameter-free do LDA rất nhanh và ổn định. Vượt mặt MDM về độ chính xác trên diện rộng.14

Đòi hỏi tính toán khoảng cách đến nhiều điểm trung bình hơn, gia tăng chi phí phần cứng một lượng nhỏ.14

TS Classifier (Tangent Space + LR/SVM)

Không gian phẳng Euclidean

Chiếu toàn bộ ma trận huấn luyện lên Không gian Tiếp tuyến. Áp dụng Hồi quy Logistic (LR) hoặc Linear SVM để vạch siêu phẳng phân tách.

Cho độ chính xác cao nhất (State-of-the-art), thống trị hầu hết các cuộc thi học máy. Khả năng tích hợp với mọi mạng nơ-ron truyền thống.12

Cần quy trình tìm kiếm lưới (grid-search) tối ưu hóa siêu tham số (C-value của SVM), có nguy cơ overfitting nếu thiếu dữ liệu.14

FgMDM (Geodesic Filtering MDM)

Trực tiếp trên đa tạp cong

Áp dụng các bộ lọc rút gọn dọc theo đường trắc địa để cô lập các dải sóng não quan trọng trước khi chạy MDM phân loại.

Hiệu năng ấn tượng đối với dữ liệu nhận dạng cảm xúc cao chiều bị thay đổi môi trường.3

Yêu cầu thiết lập tùy chỉnh phức tạp cho từng nhóm cảm xúc.

Trên thực tế, trong mô hình nhận diện tâm trí đa nhãn (trung lập, tiệc tùng, bạo lực), khi các thuật toán KNN hoặc SVM Euclidean hoàn toàn bế tắc, mô hình Riemannian đã giải mã phân loại một cách dễ dàng nhờ duy trì được thuộc tính khoảng cách không gian.16

Ở chiều khác, đối với phương pháp Ma trận Hiệp phương sai Tăng cường ứng dụng cho P300 BCI, mô hình Riemannian theo dạng "cắm và chạy" (Plug&Play P300 BCI) thể hiện sự chênh lệch chất lượng đáng kinh ngạc. Nó không chỉ cung cấp hiệu năng vượt trội, mà khi đối mặt với dữ liệu nhiễu cao, khác biệt về kết quả giữa thuật toán MDM và các hệ thống lọc cổ điển là có ý nghĩa thống kê cực kỳ rõ ràng (kiểm định t-test cho mẫu cặp chứng minh MDM đánh bại bộ lọc với , ; và vượt qua thuật toán hồi quy bước với , ).43 Đặc biệt với những người dùng có khả năng điều khiển sóng não kém (BDI illiterate, hiệu suất ), các bộ phân loại Riemannian khôi phục tỷ lệ thành công của họ về ngưỡng khả thi.44

7. Giải quyết Nhiễu Ngoại Lai Trực tuyến: Hệ thống Riemannian Potato

Trong quá trình đưa hệ thống BCI từ phòng lab ra đời thực, gót chân Achilles của mọi mô hình chính là nhiễu động học. Dữ liệu sóng não bị vấy bẩn liên tục bởi tín hiệu cơ bắp (EMG), tín hiệu mắt (EOG - chớp mắt), và nguồn can nhiễu môi trường, dẫn đến sự sụt giảm chất lượng (SNR) khủng khiếp.6 Nếu để nhiễu lọt vào bộ thu thập, nó sẽ ngay lập tức làm lệch trọng tâm Karcher, đẩy mô hình phân loại đến sai lầm.45

Để đảm đương nhiệm vụ làm sạch thời gian thực, thuật toán giám sát không giám sát mang tên Riemannian Potato (Củ Khoai Tây Riemannian) đã ra đời, đóng vai trò như một bộ đánh giá Chỉ số Chất lượng Tín hiệu (Signal Quality Index - SQI) trực tuyến.6

7.1 Giai đoạn Hiệu chuẩn và Triển khai

Bước vào giai đoạn hiệu chuẩn ngoại tuyến (offline calibration), thuật toán tiêu thụ một chuỗi ngắn dữ liệu ban đầu hoàn toàn sạch (ví dụ: 40-45 khung tín hiệu) để tính toán ma trận tham chiếu trung bình Karcher.45 Từ trung bình này, thuật toán trích xuất độ lệch chuẩn khoảng cách từ các ma trận đến trung bình, và cấu hình một ngưỡng chỉ số Z-score (thông thường được cài đặt ).45 Hệ thống vạch ra một vùng chấp nhận (acceptability region) bao quanh tâm, trên mặt phẳng không gian chiếu 2D, đường viền đồng mức (isocontour) này cong uốn lượn trông giống hệt như củ khoai tây, cung cấp danh xưng cho thuật toán.45

Bất kỳ một sự kiện điện não mới nào tiến vào thiết bị, nếu ma trận hiệp phương sai của nó nằm ngoài giới hạn củ khoai tây (z-score > 2.0), nó lập tức bị gán cờ đỏ là nhiễu ngoại lai (artifact) và bị cách ly khỏi bộ đệm bộ phân loại.6

7.2 Tính Thích ứng Dữ liệu: Chế độ Tĩnh và Bán Động

Lợi thế của Riemannian Potato nằm ở chiến lược chống lại sự trôi dạt dữ liệu (signal drift). Sự trôi dạt là bản chất tự nhiên, khi con người cảm thấy mệt mỏi theo thời gian, ma trận não của họ cũng xê dịch.45

  • Mô hình Tĩnh (Static Potato): Khóa vĩnh viễn trọng tâm và độ lệch chuẩn sau bước hiệu chuẩn. Cực nhanh nhưng dễ khiến hệ thống vứt bỏ nhầm những tín hiệu não hợp lệ bị trôi dạt tự nhiên (làm hỏng độ nhạy/hiệu quả theo thời gian).45
  • Mô hình Bán Động (Semi-Dynamic Potato): Thuật toán kích hoạt một bản lề logic tinh vi. Nếu tín hiệu được phán đoán là sạch (z-score < 2.0), thuật toán sẽ tiến hành cập nhật từng phần (partial fit) lại các tham số. Trọng tâm và phân bố khoảng cách mới sẽ được thiết lập với một hệ số thích nghi (adaptation rate) là (với là số chỉ mục khung thời gian).6 Bằng cách này, "củ khoai tây" dần dần di chuyển, bám theo hành vi sinh lý thay đổi theo thời gian của người dùng mà không bị các cử động bất thường đánh lừa.45

Khi số lượng cảm biến tăng vọt (EEG mật độ cao với 64 hoặc 128 kênh), không gian đa tạp mở rộng khiến củ khoai tây phình to quá mức, làm loãng độ nhạy (sensitivity) phát hiện nhiễu.46 Công nghệ Riemannian Potato Field (RPF) giải bài toán này bằng cách triển khai hàng chục củ khoai tây nhỏ (potato nodes), mỗi củ phân tích trên một nhóm nhỏ các điện cực, sau đó bỏ phiếu thông qua một mạng lưới tổng hợp để tạo thành một SQI hợp nhất.6 Khung RPF này đã chứng minh khả năng dọn dẹp xuất sắc trên hơn 2200 giờ ghi dữ liệu điện não liên tục trong môi trường tại nhà hoàn toàn thiếu kiểm soát.6

8. Học Chuyển giao và Thích ứng Miền (Transfer Learning & Domain Adaptation)

Sự chuyển dịch dữ liệu do tính phi dừng gây ra không chỉ là rào cản theo thời gian trong một buổi thí nghiệm, mà là hố đen thực sự khi cố gắng đưa hệ thống BCI cho một người dùng mới chưa từng sử dụng (Cross-subject), hoặc cho chính người dùng đó sử dụng vào một ngày khác (Cross-session).4 Quá trình gọi là Covariance Shift này sẽ xé toạc các siêu phẳng được học từ trước. Việc đào tạo lại toàn bộ mạng phân loại đòi hỏi một pha hiệu chuẩn dài đặc biệt nhàm chán.1

Để cứu vãn, học chuyển giao dựa trên Thích ứng miền ra đời, cốt lõi là làm khớp phân bố của bộ dữ liệu nguồn lịch sử (Source Dataset ) lên bộ dữ liệu đích thực tế hiện thời (Target Dataset ).4 Thuật toán nền tảng là Phân tích Riemannian Procrustes (RPA), thực hiện các phép tịnh tiến không gian, kéo giãn và xoay ma trận hiệp phương sai.4 Như đã cảnh báo, RPA kinh điển sử dụng khoảng cách AIRM sẽ tạo ra hiện tượng thắt cổ chai về CPU do cần ma trận nghịch đảo và vòng lặp Karcher liên tục, cản trở việc cập nhật online.4 Hai giao thức hiện đại dựa trên Log-Euclidean Metric (LEM) được phát triển để tăng tốc hệ thống: PA-LEM và RPA-LEM.4

8.1 Giao thức PA-LEM và Cấu trúc RPA-LEM

1. Giao thức PA-LEM (Procrustes Analysis based on Log-Euclidean Metric): Phương pháp này nén và biến đổi mọi ma trận về miền logarithm (nơi chúng tuân thủ metric phẳng Euclidean).4 PA-LEM hoạt động theo cơ chế chuẩn hóa dữ liệu trực tiếp: tính trung bình log, tìm độ phân tán (variance) cho dữ liệu nguồn, rồi trừ đi trung bình và chia cho độ phân tán. Phương trình chuẩn hóa giúp mọi dữ liệu có trung bình bằng 0 và phương sai bằng 1.4 Dù tốc độ của nó là ánh sáng, việc quy chụp đa tạp thành một mặt phẳng vô tình làm mất tính năng nhận diện độ cong không gian (geometry-aware), gây bất lợi tới độ chính xác thực tế.4

2. Giao thức RPA-LEM (Riemannian Procrustes Analysis based on LEM): Kỹ thuật này giữ nguyên sự tôn trọng với tính đa chiều của cấu trúc bề mặt. Hai bước thực hiện gồm 4:

  • Tái định tâm (Re-centering - Rct): Dịch chuyển điểm gốc của phân bố nguồn và đích (trọng tâm ) trượt dọc theo đường trắc địa cho đến khi chúng hội tụ và trùng khớp với ma trận đơn vị , biến thành rốn của hệ sinh thái tọa độ.4
  • Kéo dãn (Stretching - Str): Khám phá sự chênh lệch về độ phân tán (của nguồn) và (của đích). Cưỡng ép giãn nở hoặc thu hẹp dữ liệu đích thông qua một hệ số trượt để đồng bộ kích thước đám mây dữ liệu.4

Theo quy luật Procrustes cổ điển phải có thêm bước Xoay (Rotation), nhưng đối với tín hiệu BCI, thực nghiệm xác nhận việc xoay không cải thiện mà làm nhiễu thông tin định hướng không gian của vỏ não vận động (MI), do đó phép xoay bị loại bỏ hoàn toàn.4

8.2 Hiệu năng Vượt bậc của Bộ phân loại PLVQ-LEML + RPA-LEM

Hai thuật toán trên chỉ đảm nhiệm vai trò canh lề dữ liệu. Để giải mã, chúng được tích hợp cùng PLVQ-LEML (Probabilistic Learning Vector Quantization with Log-Euclidean Metric Learning) - một bộ phân loại cực nhanh do Zhang và Tang phát triển (2022). PLVQ-LEML kết hợp tốc độ của LEM với cơ chế học vector nguyên mẫu, trong đó tốc độ học (learning rate) được thiết kế theo cấu trúc làm mát dần (annealing schedule), cụ thể .4

Các bảng thực nghiệm dưới đây trích dẫn độ chính xác khi áp dụng cho hai nhóm dữ liệu kinh điển để chứng minh sức mạnh của RPA-LEM. Hệ thống ưu tiên chọn chỉ sử dụng Re-center (Rct) vì phép dãn (Rct+str) thường gây tụt giảm nhẹ. Tham số hyperparameter sử dụng vòng xác thực chéo (cross-validation) để tìm số lượng prototype (quanh 1-2) và phương sai (quanh 1.5 - 6).4

Bảng 2: So sánh Độ chính xác phân loại Cross-Subject trên tập BCI IV 2a (MI) 4

Subject (Người dùng)

Tham số (N, σ2)

RPA gốc (Rct)

PA-LEM (Rct)

RPA-LEM (Rct)

S1

1, 1.5

0.8244

0.8009

0.8250

S3

1, 2.0

0.8537

0.8565

0.8503

S7

2, 6.0

0.8105

0.8009

0.8105

S8

1, 1.5

0.7728

0.7453

0.7799

S9

1, 3.0

0.7596

0.7222

0.7707

Giá trị Trung Bình (9 users)

N/A

0.6251

0.6018

0.6274

Bảng 3: So sánh Độ chính xác Cross-Session trên tập BCI III IIIa 4

Subject

Tham số (N, σ2)

Không chuyển giao (Baseline)

RPA gốc (Rct)

RPA-LEM (Rct)

k3b

1, 5.0

0.9185

0.9200

0.9259

k6b

2, 4.5

0.4556

0.4736

0.4778

l1b

1, 4.5

0.7333

0.7411

0.7444

Giá trị Trung Bình

N/A

0.7025

0.7116

0.7160

Phân tích kết quả thực nghiệm một cách rành mạch cho thấy RPA-LEM có chỉ số phân loại trung bình ( ở tập IV 2a và ở III 3a) vượt qua mô hình RPA gốc (sử dụng AIRM), đồng thời phá nát mô hình phẳng PA-LEM.4 Điểm bùng nổ của thiết kế này là thời gian xử lý CPU giảm đi từ các phép tính chi phí khối của ma trận nghịch đảo sang chi phí khối hoàn toàn tuyến tính, mở đường cho những hệ thống BCI thích ứng liên tục mà không bao giờ bị nghẽn phần cứng.4

9. Sự Trỗi dậy của Mạng Học Sâu Riemannian (Deep Riemannian Networks - DRNs)

Mặc dù các máy phân loại phẳng tĩnh như TS+LR cung cấp tính chắc chắn cho mô hình nhỏ, sự phát triển bùng nổ của Học Sâu (Deep Learning) không thể làm ngơ trước EEG. Tuy nhiên, việc đẩy thẳng các ma trận não vào mạng Tích chập (ConvNets), LSTM hay Transformer tạo ra một rào cản: các mô hình này thiết kế trên quy tắc toán Euclidean, do đó nếu ép các ma trận SPD qua chúng, đặc tính đối xứng và xác định dương sẽ bị biến dạng không phục hồi.5 Lối thoát duy nhất là nhúng thẳng các phép toán vi phân cong vào các node mạng nơ-ron: Kiến tạo Deep Riemannian Networks (DRNs).50

Đóng vai trò nền móng mạnh nhất trong DRNs là SPDNet, được Huang và Gool ra mắt năm 2016, hoạt động qua 3 lớp xử lý chuyên biệt bảo vệ cấu trúc hình học ở mỗi bước lan truyền tiến (forward propagation) 51:

  1. Lớp BiMap (Bilinear Mapping): Đóng vai trò là một lớp tích chập giảm chiều (dimensionality reduction layer) hoạt động qua công thức (với là ma trận trọng số khả tinh chỉnh qua backpropagation). Việc nhân song tuyến này đảm bảo rằng kết quả đẩy ra nhỏ hơn nhưng luôn là ma trận SPD.51
  2. Lớp ReEig (Rectified Eigenvalues): Đóng vai trò như hàm kích hoạt phi tuyến tương tự ReLU. Khi BiMap bóp dữ liệu quá mạnh (under-parameterized), một số trị riêng tụt xuống mấp mé âm gây vỡ ma trận. ReEig thiết lập một rào chắn: nếu trị riêng , nó lập tức bị san lấp thành (cụ thể là ), phục hồi sức khỏe hình thái cho dữ liệu.51
  3. Lớp LogEig (Riemannian Transform): Tồn tại ở phần cuối đường truyền, làm trắng dữ liệu (data whitening) và áp dụng ánh xạ Log-Euclidean kéo dữ liệu về không gian tiếp tuyến, mở trói cho các hàm mất mát (softmax) để kết thúc mạng học.51

9.1 Giao thức End-to-end: So sánh EE(G)-SPDNet và FBSPDNet

Một nhược điểm của việc áp dụng trực tiếp SPDNet cho EEG là não bộ rung động mạnh mẽ theo các dải phổ tần số khác nhau. Các dải truyền thống (alpha, beta, gamma) được xác định bởi sinh lý học, nhưng các mô hình DRNs với khả năng học bộ lọc (filterbank learning) đã chứng minh rằng các băng tần này không đại diện cho điểm tối ưu toàn cục của giải mã.49

Để khai mở sức mạnh, hai cấu trúc SPDNet mở rộng đã được phát triển 50:

  • EE(G)-SPDNet (Dựa trên Convolutional Learning): Một mạng thực sự từ đầu-đến-cuối (end-to-end). Ở tầng trên cùng, một lớp tích chập đóng vai trò như bộ lọc phổ thời gian (mimic filterbanking). Thay vì phải chọn tần số thủ công, mô hình này liên tục tinh chỉnh bộ lọc trong suốt quá trình backpropagation để "lắng nghe" và khóa vào chính xác băng tần tối ưu. Điều đặc biệt là cấu trúc này hỗ trợ khả năng phân tách theo kênh (Channel Specificity - ChSpec), tạo ra các bộ lọc tùy biến riêng biệt cho từng điện cực riêng, chứng minh mức độ phức tạp sinh lý học sâu sắc hơn hẳn các dải tần truyền thống.49 Dữ liệu sau đó tạo ma trận SPD bằng lớp "SCM Pooling" và truyền xuống dưới.
  • FBSPDNet (Filterbank Optimised EEG SPDNet): Hoạt động tách bạch hơn. Mạng sử dụng một bộ Tối ưu hóa Bayesian (Bayesian Optimizer - BO) ngoại tuyến như một công cụ hộp đen (black-box). Công cụ này ném các cấu hình bộ lọc tần số khác nhau vào một bộ phân loại ủy quyền gọn nhẹ (như proxy SVM hoặc MDM Riemannian - rMDM). Khi thuật toán vòng lặp BO tìm ra dải tần tối ưu, dải tần đó bị khóa lại, sau đó dữ liệu mới được đẩy qua SPDNet.50

Dù FBSPDNet sở hữu tính diễn giải (interpretable) các biến số tần số dễ dàng, chính khả năng của kiến trúc EE(G)-SPDNet trong việc bỏ qua thiết kế thủ công, cho phép các bộ lọc tự định dạng cấu hình phi tuyến của chúng trong quá trình huấn luyện, đã đánh bại hầu hết các mạng ConvNets thế hệ trước, phô diễn sự thống trị của DRNs trên mọi mặt trận ứng dụng thực tế.49

10. Hệ sinh thái Mã Nguồn Mở và Tổng kết Triển vọng

Ngành khoa học não bộ sẽ khó tiến xa nếu thiếu đi môi trường phần mềm để kiểm chứng. Sức nóng của Hình học Riemannian đã đẩy nhanh sự ra đời của pyRiemann, một thư viện cốt lõi bằng Python, chuyên thực thi mọi thuật toán phức tạp trên đa tạp cho BCI và phân tích tín hiệu mảng siêu âm/viễn thám vi sóng SAR (Remote Sensing).26 Ưu điểm cốt lõi của hệ sinh thái này là thiết kế tuân thủ hoàn toàn các API truyền thống của thư viện scikit-learn.29 Kỹ sư chỉ cần xâu chuỗi thông qua hàm make_pipeline(Covariances(estimator="lwf"), MDM(metric="riemann")) hay TSClassifier() để tạo ra một đường ống chẩn đoán chéo cực nhanh.28 Việc mở rộng hỗ trợ Tensor PyTorch cũng cho thấy pyRiemann đang đẩy mạnh hỗ trợ tính năng gia tốc phần cứng GPU và tự đạo hàm (autograd) phục vụ xây dựng mạng SPDNet.29

Tổng kết lại, sự gia nhập của Hình học Riemannian vào Giao diện Não - Máy tính không phải là một sự lắp ghép rời rạc các công thức toán học, mà thực sự tái cấu trúc lại cách chúng ta nhận diện và biểu diễn dữ liệu của con người. Từ việc thay thế hình học Euclidean tuyến tính bằng hệ sinh thái đa tạp cong, giải quyết vấn đề hội tụ Karcher Mean, thiết lập Phép chiếu Không gian Tiếp tuyến (Tangent Space) để tạo ranh giới cho các siêu phẳng thuật toán; cho đến việc uốn cong thời gian vào không gian qua Ma trận Hiệp phương sai Tăng cường phục vụ cả ERP, MI và SSVEP. Hơn thế nữa, tính toán nhanh nhờ Metric Log-Euclidean và ứng dụng học chuyển giao trực tuyến Procrustes đã cung cấp chìa khóa cho BCI tiến sâu vào sự sống hàng ngày mà không ngập ngừng bởi bóng ma của trôi dạt tín hiệu. Khi trí tuệ nhân tạo thế hệ mới như SPDNet bắt đầu tự tinh chỉnh các đường cong vi phân ngay trong mô hình học sâu, Hình học Riemannian chính là chất xúc tác vĩ đại nhất để hệ thần kinh tương tác trơn tru và hoàn mĩ với các hệ máy tính trong tương lai gần.

Works cited

  1. Riemannian Approaches in Brain-Computer Interfaces: A Review - PubMed, accessed June 1, 2026, https://pubmed.ncbi.nlm.nih.gov/27845666/
  2. Riemannian Geometry: Speech Detection from MEG Brain Signals Towards Non-Invasive BCI | OpenReview, accessed June 1, 2026, https://openreview.net/forum?id=bkhsrCOZTu
  3. Determining Levels of Affective States with Riemannian Geometry Applied to EEG Signals, accessed June 1, 2026, https://www.mdpi.com/2076-3417/15/19/10370
  4. Riemannian transfer learning based on log-Euclidean ... - Frontiers, accessed June 1, 2026, https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2024.1381572/full
  5. Riemannian Geometry-Based EEG Approaches: A Literature Review - arXiv, accessed June 1, 2026, https://arxiv.org/html/2407.20250v1
  6. The Riemannian Potato Field: A Tool for Online Signal Quality Index of EEG - IEEE Xplore, accessed June 1, 2026, https://ieeexplore.ieee.org/iel7/7333/8637978/08612963.pdf
  7. Averaging Trajectories on the Manifold of Symmetric Positive Definite Matrices - IEEE Xplore, accessed June 1, 2026, https://ieeexplore.ieee.org/document/10715315/
  8. Selective Cross-Subject Transfer Learning Based on Riemannian Tangent Space for Motor Imagery Brain-Computer Interface - Frontiers, accessed June 1, 2026, https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2021.779231/full
  9. Riemannian BCI - Sylvain Chevallier, accessed June 1, 2026, https://sylvchev.github.io/projects/01_riemannianbci/
  10. Manifold-regression to predict from MEG/EEG brain signals without source modeling - NIPS, accessed June 1, 2026, http://papers.neurips.cc/paper/8952-manifold-regression-to-predict-from-megeeg-brain-signals-without-source-modeling.pdf
  11. accessed June 1, 2026, https://www.tandfonline.com/doi/abs/10.1080/2326263X.2017.1297192#:~:text=Despite%20its%20short%20history%2C%20the,score%20obtained%20in%20five%20recent
  12. Harmonizing and aligning M/EEG datasets with covariance-based techniques to enhance predictive regression modeling - PMC, accessed June 1, 2026, https://pmc.ncbi.nlm.nih.gov/articles/PMC12007539/
  13. Riemannian classification of covariance matrices coming from EEG signals - Université catholique de Louvain, accessed June 1, 2026, https://thesis.dial.uclouvain.be/bitstreams/fc09bfaf-2954-46c6-beb0-7cbbb61045c8/download
  14. The Riemannian Means Field Classifier for EEG-Based BCI Data ..., accessed June 1, 2026, https://pmc.ncbi.nlm.nih.gov/articles/PMC11991455/
  15. (PDF) Riemannian geometry for EEG-based brain-computer interfaces; a primer and a review - ResearchGate, accessed June 1, 2026, https://www.researchgate.net/publication/315873391_Riemannian_geometry_for_EEG-based_brain-computer_interfaces_a_primer_and_a_review
  16. Hyperscanning EEG and Classification Based on Riemannian Geometry for Festive and Violent Mental State Discrimination - PMC, accessed June 1, 2026, https://pmc.ncbi.nlm.nih.gov/articles/PMC7793677/
  17. [1501.03227] Using Riemannian geometry for SSVEP-based Brain Computer Interface, accessed June 1, 2026, https://arxiv.org/abs/1501.03227
  18. Riemannian Approaches in Brain-Computer Interfaces: A Review - IEEE Xplore, accessed June 1, 2026, http://ieeexplore.ieee.org/iel7/7333/8082143/07740054.pdf
  19. The Geometric Median on Riemannian Manifolds with Application to Robust Atlas Estimation - PMC, accessed June 1, 2026, https://pmc.ncbi.nlm.nih.gov/articles/PMC2735114/
  20. Covariance Tangent Space Projection - Emergent Mind, accessed June 1, 2026, https://www.emergentmind.com/topics/covariance-tangent-space-projection-cov-tgsp
  21. A Riemannian Limited-Memory BFGS Algorithm for Computing the Matrix Geometric Mean - FSU Math, accessed June 1, 2026, https://www.math.fsu.edu/~whuang2/pdf/KarcherMean_techrep.pdf
  22. optimization methods for the Karcher mean, accessed June 1, 2026, https://cdn.fs.pathlms.com/tIHexvSJRVqaAKZZmBHX
  23. A Riemannian quasi-Newton method for computing the Karcher mean of symmetric positive definite matrices - FSU Math - Florida State University, accessed June 1, 2026, https://www.math.fsu.edu/~aluffi/archive/paper519.pdf
  24. ALGORITHM COMPARISON FOR KARCHER MEAN COMPUTATION OF ROTATION MATRICES AND DIFFUSION TENSORS - Université catholique de Louvain, accessed June 1, 2026, https://sites.uclouvain.be/absil/Publi/2011-007_Karcher/eusipco2011_Rentmeesters_Absil.pdf
  25. The impact of covariance matrix estimators on Riemannian EEG BCI - Aaltodoc, accessed June 1, 2026, https://aaltodoc.aalto.fi/server/api/core/bitstreams/aabe7834-1af1-470b-8ec1-add2280a2dc4/content
  26. API reference - pyRiemann 0.12.dev, accessed June 1, 2026, https://pyriemann.readthedocs.io/en/latest/api.html
  27. Algebra I: Textbook for Students of Mathematics [1st ed.] 3319452843, 978-3-319-45284-5 ... - dokumen.pub, accessed June 1, 2026, https://dokumen.pub/algebra-i-textbook-for-students-of-mathematics-1st-ed-3319452843-978-3-319-45284-5-978-3-319-45285-2.html
  28. Motor imagery classification - pyRiemann 0.12.dev - Read the Docs, accessed June 1, 2026, https://pyriemann.readthedocs.io/en/latest/auto_examples/biosignal-mi/plot_single.html
  29. GitHub - pyRiemann/pyRiemann: Machine learning for multivariate data through the Riemannian geometry of positive definite matrices in Python, accessed June 1, 2026, https://github.com/pyRiemann/pyRiemann
  30. (PDF) Online SSVEP-based BCI using Riemannian geometry - ResearchGate, accessed June 1, 2026, https://www.researchgate.net/publication/299134669_Online_SSVEP-based_BCI_using_Riemannian_geometry
  31. Spatial covariance improves BCI performance for late ERPs components with high temporal variability - Infoscience, accessed June 1, 2026, https://infoscience.epfl.ch/server/api/core/bitstreams/996314fd-40fc-4fc8-8dbc-abfda676f20a/content
  32. carraraig/Augmented_Covariance_BCI - GitHub, accessed June 1, 2026, https://github.com/carraraig/Augmented_Covariance_BCI
  33. Classification of BCI-EEG based on augmented covariance matrix | Request PDF, accessed June 1, 2026, https://www.researchgate.net/publication/368393103_Classification_of_BCI-EEG_based_on_augmented_covariance_matrix
  34. Robotics research. Volume 1 978-3-319-51532-8, 3319515322, 978-3-319-51531-1, accessed June 1, 2026, https://dokumen.pub/robotics-research-volume-1-978-3-319-51532-8-3319515322-978-3-319-51531-1.html
  35. Daily Papers - Hugging Face, accessed June 1, 2026, https://huggingface.co/papers?q=Riemannian%20Langevin%20dynamics
  36. Spectral Transfer Learning Using Information Geometry for a User-Independent Brain-Computer Interface - Frontiers, accessed June 1, 2026, https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2016.00430/full
  37. Brain Invaders: P300 BCI Game Paradigm - Emergent Mind, accessed June 1, 2026, https://www.emergentmind.com/topics/p300-based-game-brain-invaders
  38. Manifold Embedded Knowledge Transfer for Brain-Computer Interfaces - arXiv, accessed June 1, 2026, https://arxiv.org/pdf/1910.05878
  39. Daily Papers - Hugging Face, accessed June 1, 2026, https://huggingface.co/papers?q=Sobolev-induced%20Riemannian%20geometry
  40. Learning from small datasets—review of workshop 6 of the 10th, accessed June 1, 2026, https://repository.ubn.ru.nl/bitstream/handle/2066/320633/320633.pdf?sequence=1&isAllowed=y
  41. Toward Measuring Target Perception: First-Order and Second-Order Deep Network Pipeline for Classification of Fixation-Related Potentials - PMC, accessed June 1, 2026, https://pmc.ncbi.nlm.nih.gov/articles/PMC7690996/
  42. pyRiemann 0.12.dev - Read the Docs, accessed June 1, 2026, https://pyriemann.readthedocs.io/
  43. A plug&Play P300 BCI using information geometry - ResearchGate, accessed June 1, 2026, https://www.researchgate.net/publication/265252392_A_plugPlay_P300_BCI_using_information_geometry
  44. A Plug&Play P300 BCI Using Information Geometry - arXiv, accessed June 1, 2026, https://arxiv.org/pdf/1409.0107
  45. Online Artifact Detection with Riemannian Potato - pyRiemann 0.12 ..., accessed June 1, 2026, https://pyriemann.readthedocs.io/en/latest/auto_examples/artifacts/plot_detect_riemannian_potato_EEG.html
  46. The Riemannian Potato Field: A Tool for Online Signal Quality Index of EEG - PubMed, accessed June 1, 2026, https://pubmed.ncbi.nlm.nih.gov/30668501/
  47. Online Artifact Detection with Riemannian Potato Field - pyRiemann 0.12.dev, accessed June 1, 2026, https://pyriemann.readthedocs.io/en/latest/auto_examples/artifacts/plot_detect_riemannian_potato_field_EEG.html
  48. NeurIPS Poster GeoDynamics: A Geometric State‑Space Neural Network for Understanding Brain Dynamics on Riemannian Manifolds, accessed June 1, 2026, https://neurips.cc/virtual/2025/poster/136222
  49. [2212.10426] Deep Riemannian Networks for End-to-End EEG Decoding - arXiv, accessed June 1, 2026, https://arxiv.org/abs/2212.10426
  50. Deep Riemannian Networks for end-to-end EEG decoding - PMC - NIH, accessed June 1, 2026, https://pmc.ncbi.nlm.nih.gov/articles/PMC12319850/
  51. Deep Riemannian Networks for end-to-end EEG decoding | Imaging ..., accessed June 1, 2026, https://direct.mit.edu/imag/article/doi/10.1162/imag_a_00511/128245/Deep-Riemannian-Networks-for-end-to-end-EEG
  52. Deep Riemannian Networks for End-to-End EEG Decoding - arXiv, accessed June 1, 2026, https://arxiv.org/html/2212.10426v7