En el artículo anterior presentamos los principios de la fotopletismografía remota y los diferentes campos de aplicación, tanto para pulseras inteligente como para pulsioxímetros. En esta ocasión nos centraremos en la fotopletismografía remota basada en vídeo, la técnica que constituye las bases del proyecto AIVA para la medición de constantes vitales usando únicamente la cámara frontal un smartphone.
La fotopletismografía remota basada en vídeo ha sido un tema de investigación que ha despertado gran interés en los últimos años, ya que permite medir las constantes vitales a partir de imágenes o vídeos faciales mediante el análisis de pequeñas variaciones de color o movimientos corporales. Esta aplicación práctica de la tecnología PPG de manera completamente no invasiva se conoce como fotopletismografía remota basad en vídeo (vrPPG, por sus siglas en inglés). Puede predecir tanto la frecuencia cardíaca como la variabilidad de la frecuencia cardíaca y la presión arterial, infiriendo así el estrés mental, variaciones en las funciones cardiovasculares, la calidad del sueño y la somnolencia. La llegada del smartphone y de las cámaras digitales de alta resolución ha aumentado el interés por esta técnica en los últimos años, extendiendo su aplicación a diversos campos:
- Cuidado hospitalario;
- Telemedicina;
- Evaluación de la condición física;
- Reconocimiento del movimiento;
- Automoción.
La fotopletismografía remota basada en vídeo utiliza el principio de la PPG que ya vimos en el artículo anterior. Se basa en una cámara y luego mide los cambios de reflexión de luz roja, verde y azul en la piel como el contraste entre las reflexiones especulares y de difusión, como se muestra en la siguiente figura. Se registran y procesan imágenes o vídeos de la piel humana bajo fuentes de luz ambiental o con iluminación dedicada para recuperar la señal de fotopletismografía a partir de la cual se extraen parámetros fisiológicos. Una componente de reflexión difusa lleva la información de la PPG a medida que se difunde a través de la piel, mientras que una componente de reflexión especular es el que se dispersa por la superficie de la piel. Aunque el componente especular no tiene información del pulso, la luz reflejada total observada por la cámara depende de la contribución relativa de ambas componentes.
En esencia, los cambios en el volumen sanguíneo durante un ciclo cardíaco causarían cambios de color mínimos en la piel. Aunque estos cambios son invisibles al ojo humano, podrían ser capturados por sensores ópticos como el objetivo de una cámara digital. La medición precisa de estos cambios genera una señal de fotopletismografía, a partir de la cual se pueden medir signos vitales del cuerpo, como la frecuencia cardíaca, la variabilidad de la frecuencia cardíaca y la frecuencia respiratoria.
Entonces, ¿qué proceso se debe seguir para extraer esta información?
Para extraer esta información, existe un proceso básico, sobre el que luego existen muchas variantes. Estas variantes se basan en técnicas destinadas a contrarrestar el efecto de algunas acciones tales como el movimiento del sujeto durante el proceso de medida o los cambios en la iluminación. De hecho, el surgimiento de las técnicas de aprendizaje máquina y aprendizaje profundo en los últimos años, ha permitido obtener las constates vitales de una manera más precisa y reducir los efectos anteriores que pueden llevar a errores en la medida. El método tradicional consta de las siguientes fases:
En primer lugar, se define una región de interés (ROI, por sus siglas en inglés), que suele cubrir la región de la cara del sujeto. No obstante, algunos artículos se centran en la medida de puntos concretos de la cara (la frente, las mejillas, etc) por ser más significativos. De hecho, últimamente ha ganado bastante popularidad el modelo de Imagen Óptica Transdérmica (TOI, por sus siglas en inglés), que se va fijando en diversos puntos de la cara en diferentes instantes temporales con la intención de obtener una señal de mayor calidad que cuando nos centramos en una región concreta de la cara.
En segundo lugar, para obtener las trazas de la señala, las ROIs detectadas se separan en diferentes canales RGB para, posteriormente, promediar espacialmente sobre todos los píxeles y obtener las trazas de señal roja, verde y azul. Sobre estas señales se aplican diferentes técnicas tales como filtrado y reducción de dimensionalidad. El filtrado permite reducir el ruido causado por acciones tales como la iluminación o el movimiento durante el proceso de medida mientras que la reducción de dimensionalidad permite reducir la dimensionalidad de las señales anteriores obteniendo una señal PPG más precisa y robusta.
Tras lo anterior, se lleva a cabo la estimación de las constantes vitales sobre la señal resultado aplicando diferentes técnicas basadas en el análisis de la señal en el dominio de la frecuencia (FFT, DCT ó STFT). Estas técnicas consideran que la señal periódica más fuerte en la banda de frecuencias de interés (por ejemplo, 1 y 3.3Hz para la frecuencia cardíaca) es la señal con la información de PPG y sobre esta señal se lleva a cabo el procesamiento, especialmente en el caso de la frecuencia cardíaca.
No obstante, como se indicaba anteriormente, las técnicas más recientes incluyen el uso del aprendizaje automático para obtener las constantes vitales directamente sobre el vídeo, aprendiendo el mecanismo de rPPG desde el principio. Estas técnicas basadas en aprendizaje se pueden dividir en dos categorías: métodos de aprendizaje supervisado y métodos de aprendizaje de extremo a extremo. Una ilustración del flujo de trabajo se puede ver en la siguiente imagen. Con el enfoque de aprendizaje supervisado, la extracción de características debe ser realizada manualmente, mientras que los métodos de aprendizaje profundo extraen características directamente del video de entrada sin intervención humana, utilizando técnicas tales como la visión por computador (computer vision, en inglés).
A lo largo de los próximos meses, AIVA ahondará en las técnicas que mejor se adaptan a nuestras necesidades e investigará en nuevas soluciones destinadas a mejorar la robustez de la señal, avanzado con respecto al estado del arte actual. Esta investigación es muy relevante ya que su progreso permitirá reducir el número de dispositivos invasivos requeridos a la hora de monitorizar a personas o pacientes afectados, por ejemplo, por enfermedades cardiovasculares o que requieren hospitalización domiciliaria. Este caso es especialmente relevante para nuestra empresa, Hi-Iberia, ya que su herramienta de asistencia sanitaria remota, REVITA, está siendo usada en varios hospitales a nivel nacional y la inclusión de estas tecnologías supondría un gran impulso para nuestra plataforma.