Athrun Data Intelligence


Trabajes o no en la industria de la tecnología, es muy improbable que no hayas escuchado sobre la inteligencia sintético, la cual ha llegado a nuestras vidas al parecer para quedarse y hacernos en muchos ámbitos las cosas más fáciles. Interiormente de este amplio mundo se tienen diferentes subáreas, y en relación con el estudio de datos, el formación maquinal (“Machine Learning”) es una útil poderosa, que nos permite ocasionar modelos de predicción a partir de los datos.

En un principio ocasionar modelos de formación maquinal, era una tarea titánica que implicaba conocer en detalle las matemáticas asociadas a cada uno de los modelos, pues solo de esta forma se podía ocasionar la dialéctica que hiciese todos los cálculos necesarios, como los son por ejemplo. las iteraciones sobre las diferentes ecuaciones, para ajustar los parámetros matemáticos asociados a las mismas.

Pero este proceso ha cambiado mucho, herramientas como Scikit-learn (Sklearn) han simplificado enormemente el proceso de construir y aplicar modelos predictivos. Con solo unas pocas líneas de código, podemos entrenar y evaluar modelos preferidos para una variedad de tareas, como lo son la clasificación y regresión. Sin bloqueo, detrás de esta patente simplicidad se esconde un arduo entramado matemático que es fundamental comprender para utilizar estas herramientas de modo efectiva.

La Caja Negra:

Sklearn y otras bibliotecas de formación maquinal ofrecen una “caja negra” que oculta gran parte de la complejidad subyacente. Esto es utópico para aquellos que buscan resultados rápidos y no desean sumergirse en los detalles técnicos. Sin bloqueo, esta conveniencia puede ser engañosa. Al dejarlo en Dios solamente en las funciones predefinidas, los usuarios corren el peligro de aplicar modelos sin comprender completamente su funcionamiento interno y, lo que es más importante, su idoneidad para el problema en cuestión.

El papel de las ciencias:

Para utilizar el formación maquinal de modo efectiva, es crucial comprender la matemática que subyace a los algoritmos. Esto implica tener una comprensión sólida de conceptos de álgebra derecho, cálculo y estadística. Estos conceptos permiten tomar decisiones informadas de que usar para determinado problema, lo que resulta en un uso más capaz de los posibles, puesto que se puede ascender de modo más directa a los modelos correctos y a los hiperparámetros correctos, evitando largas jornadas de uso de enumeración. entrenando modelos que desde su planteamiento matemático no son adecuados para una determinada tarea.

Ejemplos de concretos:

Imaginemos que queremos predecir los precios de las viviendas en función de diversas características, como el tamaño, la ubicación y el número de habitaciones. Podríamos usar un maniquí de regresión derecho para esto, que asume una relación derecho entre las características y el precio. Sin bloqueo, si no comprendemos completamente cómo funciona la regresión derecho y sus supuestos, podríamos estar ignorando otras técnicas más adecuadas para nuestros datos, como la regresión polinómica o los métodos de formación no lineales, los cuales tienen una veterano capacidad para modelar un engendro más. arduo.

El susodicho sería un caso global, que se puede evitar con un carta militar de las matemáticas asociadas a cada método constante.

Como segundo ejemplo tenemos un tablado donde estamos clasificando correos electrónicos como “spam” o “no spam” utilizando Naive Bayes. Una de las características que consideramos es la frecuencia de ciertas palabras en el cuerpo del correo electrónico. Supongamos que tenemos dos palabras: “proposición” y “descuento”.

En un conjunto de datos específicos, encontramos que la presencia de la palabra “proposición” está fuertemente asociada con la palabra “descuento” en correos electrónicos de spam. Es afirmar, si un correo electrónico contiene la palabra “proposición”, es muy probable que asimismo contenga la palabra “descuento”. Esta asociación puede deberse a que quienes se dedican a ocasionar estos correos, suelen utilizar ambas palabras en conjunto para promocionar productos o servicios.

Sin bloqueo, Naive Bayes asume independencia condicional entre las características, lo que significa que considera que la presencia de una palabra es independiente de la presencia de otra palabra dada la protocolo de clase (spam o no spam). En este caso, esa suposición de independencia sería incorrecta, ya que la presencia de la palabra “proposición” influye en la probabilidad de que asimismo esté presente la palabra “descuento”.

Como resultado, Naive Bayes podría clasificar incorrectamente algunos correos electrónicos. Por ejemplo, podría clasificar erróneamente como “no spam” un correo electrónico que contiene la palabra “proposición” pero no “descuento”, ya que supone que la presencia de “proposición” no está relacionada con la presencia de “descuento”. Esto ilustra un tablado donde Naive Bayes no puede proporcionar una clasificación óptima correcto a la desatiendo de independencia condicional entre las características.

Cuidado el maniquí ese conocimiento más profundo del cálculo asociado, nos ayudaría a entender, resultado no esperado como los que se describieron.

Pero la preeminencia que nos proporciona el conocimiento de estas ciencias va más allá de la mera selección de un maniquí, en otras etapas del avance de los mismos, como el ajuste de los hiperparámetros podemos sacar preeminencia a la hora de planear la organización en la que Optimizamos un maniquí determinado, si sabemos cual es el significado matemático de cada hiperparámetro, y luego su implicancia, es afirmar, sabremos de antemano desde la teoría que hiperparámetros modificar para ascender a los resultados esperados.

Si perfectamente las bibliotecas de formación maquinal como Sklearn brindan entrada rápido a poderosos algoritmos, es fundamental no obedecer exclusivamente de ellas. Comprender la matemática detrás de estos algoritmos nos permite preferir el maniquí adecuado, interpretar los resultados de modo más significativa y, en última instancia, tomar decisiones más informadas en la resolución de problemas del mundo auténtico. En un campo tan dinámico y en constante desarrollo como el formación maquinal, la comprensión matemática y estadística es el inicio sobre el cual se construyen soluciones inteligentes y efectivas.


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *