Aprendiendo Química

Bienvenidos a la primera clase del curso Introducción a la Quimiometría QM-2515, de la Universidad Simón Bolívar

¿Qué es la Quimiometría?

La quimometría es la rama de la química que se enfoca en la aplicación de métodos matemáticos o estadísticos sobre los datos químicos. En el año 1975 la (ICS) International Chemometrics Society, la definió como: “la disciplina química que utiliza métodos matemáticos y estadísticos para diseñar o seleccionar procedimientos de medida y experimentos óptimos, y para proporcionar la máxima información química mediante el análisis de datos químicos”

Por otro lado, la quimiometría es inherentemente interdisciplinaria, llegando a utilizar métodos de disciplinas básicas de análisis de datos, las matemáticas aplicadas, los métodos numéricos, estadística multivariada y la informática, para poder abordar problemas de química, bioquímica, medicina e ingeniería química.

Esta rama de la química es clave para resolver misterios y predecir el futuro, lo que le hace que sea de gran utilidad en otras ciencias naturales. En el lado descriptivo, ayuda a desentrañar las relaciones ocultas y la estructura de los sistemas químicos, brindando una comprensión más profunda y la capacidad de identificar patrones; y por el lado predictivo, permite prever nuevas propiedades y comportamientos, lo que es esencial para la innovación y el avance científico. Ya sea que estés lidiando con conjuntos de datos pequeños o enormes y complejos, la quimiometría es un gran aliado.

¿Cuáles son los orígenes de la quimiometría?

Este emocionante campo de la química nació en la década de 1970, justo cuando las computadoras comenzaron a cambiar el juego en la investigación científica. Fue entonces cuando el término “quimiometría” vio la luz, gracias a Svante Wold, quien lo presentó en una solicitud de subvención en 1971. Acompañado de Bruce Kowalski, otro visionario de esta área creador de la Sociedad Internacional de Quimiometría.

Las primeras aplicaciones se centraron en la clasificación multivariada, pero pronto surgieron emocionantes aplicaciones predictivas cuantitativas. ¡A finales de los años 70 y principios de los 80, la quimiometría estaba en pleno auge, revolucionando la química y otras ciencias naturales!

El análisis multivariado desempeñó un papel crucial desde el principio. Las técnicas como el análisis de componentes principales (PCA) y mínimos cuadrados parciales (PLS) demostraron ser esenciales para lidiar con datos complejos de espectroscopía, espectrometría de masas, resonancia magnética nuclear y más. Estas técnicas no solo ayudaron a modelar la estructura de los datos, sino que también abrieron la puerta a la regresión, el agrupamiento y el reconocimiento de patrones.

En la década de 1980, surgieron revistas especializadas y libros importantes que ayudaron a establecer la quimiometría como un campo distinguido. A medida que pasaron los años, se expandió a áreas como el modelado molecular, la quimioinformática, la genómica y la proteómica, transformando la forma en que entendemos y aplicamos la química en la ciencia moderna.

¿Qué herramientas computacionales se suelen usar?

Entre las herramientas computacionales utilizadas para el tratamiento de los datos en química se tiene:

  • Excel: es una poderosa aplicación de hoja de cálculo desarrollada por Microsoft. Permite a los usuarios crear, organizar y analizar datos en forma de tablas, realizar cálculos matemáticos y estadísticos, crear gráficos y visualizaciones, y automatizar tareas mediante fórmulas y macros. Es ampliamente utilizado en el ámbito empresarial, académico y personal para gestionar información y tomar decisiones basadas en datos de manera eficiente.
  • Python: es un lenguaje de programación de alto nivel y de código abierto ampliamente utilizado en desarrollo de software, análisis de datos, inteligencia artificial, y muchas otras aplicaciones. Se destaca por su sintaxis clara y legible, lo que lo hace fácil de aprender y utilizar. Python ofrece una amplia variedad de bibliotecas y módulos que facilitan tareas específicas, lo que lo convierte en una herramienta versátil para programadores y científicos de datos. Su comunidad activa y el soporte multiplataforma lo convierten en una opción popular para una variedad de proyectos de programación.
  • R: es un poderoso y versátil lenguaje de programación y entorno de desarrollo diseñado especialmente para análisis estadísticos y gráficos. Es ampliamente utilizado en la investigación científica, la estadística, la minería de datos y el análisis de datos, y se destaca por su extensa colección de paquetes y bibliotecas que lo hacen ideal para tareas estadísticas y de visualización de datos.
  • MATLAB: es un entorno de programación y software de alto rendimiento utilizado principalmente en matemáticas y ciencias de la ingeniería. Permite realizar cálculos numéricos, análisis de datos, visualización y desarrollo de algoritmos. MATLAB es ampliamente utilizado en la investigación académica y la industria para resolver problemas complejos en campos como la ingeniería, la física, la estadística y muchas otras disciplinas científicas y técnicas.
  • Octave: es un lenguaje de programación de código abierto y un entorno de desarrollo para la realización de cálculos numéricos y análisis científicos. Está diseñado para ser una alternativa de software libre a MATLAB y es utilizado en campos como las matemáticas, la física, la ingeniería y la investigación científica. Octave ofrece una amplia gama de herramientas para realizar operaciones matemáticas, análisis de datos y visualización, lo que lo convierte en una opción popular para quienes buscan una plataforma gratuita y de código abierto para realizar tareas científicas y de ingeniería.
  • Mathematica: es un sistema de álgebra computacional y un entorno de programación utilizado en matemáticas, física, ingeniería y otras disciplinas científicas y técnicas. Desarrollado por Wolfram Research, Mathematica permite realizar cálculos simbólicos y numéricos, resolver ecuaciones, graficar funciones, realizar análisis de datos y desarrollar programas personalizados para la resolución de problemas matemáticos y científicos. Es conocido por su lenguaje de programación propio, Wolfram Language, que facilita la manipulación y visualización de datos y la creación de aplicaciones interactivas. Mathematica es ampliamente utilizado en la investigación, la educación y la industria para abordar una variedad de problemas matemáticos y científicos.
  • Mathcad: es un software de matemáticas de ingeniería que combina capacidades de cálculo numérico, simbólico y de representación gráfica en una sola plataforma. Desarrollado por PTC (Parametric Technology Corporation), Mathcad se utiliza principalmente en ingeniería, ciencias y disciplinas técnicas para realizar cálculos, resolver ecuaciones, crear documentos técnicos interactivos y comunicar resultados de manera efectiva. Una de las características distintivas de Mathcad es su capacidad para mostrar matemáticas y resultados en un formato de hoja de cálculo legible por humanos, lo que facilita la comprensión y documentación de cálculos complejos. Es una herramienta valiosa para profesionales y estudiantes que trabajan en campos donde se requieren cálculos matemáticos detallados y documentación técnica.
  • Scilab: es un software de código abierto diseñado para realizar cálculos numéricos y científicos en una amplia variedad de aplicaciones. Ofrece un entorno de programación interactivo que permite a los usuarios realizar cálculos matemáticos, análisis de datos, visualización gráfica y modelado de sistemas de manera eficiente. Scilab es especialmente útil en campos como la ingeniería, la física, la química y otras disciplinas científicas y técnicas. Ofrece una amplia gama de funciones y herramientas para resolver problemas complejos, y su naturaleza de código abierto fomenta la colaboración y el desarrollo continuo por parte de la comunidad de usuarios y desarrolladores. Es una alternativa popular y gratuita a software comercial similar, como MATLAB.
  • Origin: es un software de análisis y representación de datos ampliamente utilizado en campos como la investigación científica, la ingeniería y la academia. Ofrece una amplia gama de herramientas para importar, analizar, visualizar y presentar datos de manera efectiva. Origin es conocido por su capacidad para manejar datos de diversos formatos y su flexibilidad en la creación de gráficos de alta calidad.
    Algunas de las características clave de Origin incluyen estadísticas descriptivas y pruebas de hipótesis, ajuste de curvas y modelos matemáticos, análisis de señales y procesamiento de imágenes, entre otros. Los usuarios pueden personalizar fácilmente gráficos y tablas, lo que facilita la creación de representaciones visuales atractivas de los datos.
    Origin es ampliamente utilizado para tareas como el análisis de datos experimentales, la creación de gráficos científicos, la generación de informes técnicos y la preparación de presentaciones. Su interfaz de usuario intuitiva y su amplia gama de funciones lo convierten en una herramienta valiosa para profesionales y estudiantes que trabajan con datos en entornos científicos y de investigación.
  • C: es un lenguaje de programación de alto nivel creado por Dennis Ritchie a principios de la década de 1970 en los laboratorios Bell de AT&T. Es conocido por su eficiencia y portabilidad, lo que significa que los programas escritos en C pueden ejecutarse en una amplia variedad de plataformas informáticas con relativamente pocas modificaciones. C es ampliamente utilizado en el desarrollo de sistemas operativos, aplicaciones de sistemas embebidos y software de bajo nivel, como controladores de hardware. Aunque es un lenguaje de bajo nivel en comparación con lenguajes modernos como Python o Java, proporciona un alto grado de control sobre el hardware de la computadora y es apreciado por su velocidad y eficiencia.
  • C++: es una extensión del lenguaje C desarrollada a principios de la década de 1980 por Bjarne Stroustrup. Combina las características de C con características de programación orientada a objetos (POO), lo que permite la creación de programas estructurados y orientados a objetos. C++ es conocido por su versatilidad y se utiliza en una amplia gama de aplicaciones, desde desarrollo de videojuegos hasta aplicaciones empresariales y científicas. Ofrece características avanzadas como la programación genérica y el manejo automático de la memoria a través de punteros inteligentes. También se utiliza en el desarrollo de sistemas operativos y software de alto rendimiento.
  • Fortran: (abreviatura de “Formula Translation”) es un lenguaje de programación de alto nivel diseñado específicamente para la programación científica y de ingeniería. Fue desarrollado inicialmente en la década de 1950 y ha experimentado varias revisiones y actualizaciones a lo largo de los años, siendo la última versión estándar Fortran 2018.
    Fortran se destaca por su capacidad para realizar cálculos numéricos eficientes y precisos, lo que lo hace ampliamente utilizado en campos como la física, la meteorología, la investigación académica, la simulación computacional y la ingeniería. Ofrece un conjunto de características que facilitan la manipulación de matrices, operaciones matemáticas y la gestión de datos.
    Aunque Fortran es uno de los lenguajes más antiguos, sigue siendo relevante en aplicaciones que requieren un alto rendimiento computacional, especialmente en supercomputadoras y clusters para cálculos científicos intensivos. Además, su sintaxis legible y su capacidad para realizar cálculos numéricos precisos lo convierten en una opción poderosa para la comunidad científica.

Introducción a la Quimiometría – QM2515

Clase 2 – Conociendo las computadoras