Inflexión-2.5: The Powerhouse LLM Rivaling GPT-4 y Gemini

Tabla de contenido

La IA de inflexión ha estado haciendo olas en el campo de los modelos de idiomas grandes (LLM) con su reciente inauguración de la inflexión-2.5, un modelo que compite con las LLM principales del mundo, incluidos GPT-4 de OpenAi y Gemini de Google.

El rápido aumento de la IA de inflexión ha sido impulsado aún más por una ronda de financiación masiva de $ 1.3 mil millones, dirigida por gigantes de la industria como Microsoft, Nvidia e inversores reconocidos, incluidos Reid Hoffman, Bill Gates y Eric Schmidt. Esta importante inversión lleva el financiamiento total recaudado por la compañía a $ 1.525 mil millones.

En colaboración con los socios CoreWeave y Nvidia, la IA de inflexión está construyendo el grupo de IA más grande del mundo, que comprende un GPU de núcleo tensor de tensor H100 sin precedentes. Este colosal poder informático apoyará la capacitación y el despliegue de una nueva generación de modelos de IA a gran escala, lo que permite a la IA de inflexión impulsar los límites de lo que es posible en el campo de la IA personal.

El trabajo innovador de la compañía ya ha arrojado resultados notables, con el clúster de IA de inflexión, que actualmente comprende más de 3,500 GPU de nvidia H100 Tensor Core, que ofrece un rendimiento de vanguardia en el MLPERF de referencia de código abierto. En una presentación conjunta con CoreWeave y Nvidia, el clúster completó la tarea de capacitación de referencia para modelos de idiomas grandes en solo 11 minutos, solidificando su posición como el clúster más rápido en este punto de referencia.

Este logro sigue la presentación de la inflexión-1, el modelo de lenguaje grande (LLM) de inflexión de IA, que ha sido aclamado como el mejor modelo en su clase de cómputo. Ex superan a los gigantes de la industria como GPT-3.5, LLAMA, Chinchilla y Palm-540B en una amplia gama de puntos de referencia comúnmente utilizados para comparar LLMS, la inflexión-1 permite a los usuarios interactuar con PI, la IA personal de IA, de una manera simple y natural , recibir información y asesoramiento rápido, relevante y útil.

El compromiso de la IA de inflexión con la transparencia y la reproducibilidad es evidente en la liberación de una nota técnica que detalla la evaluación y el rendimiento de la inflexión-1 en varios puntos de referencia. El memorando revela que la inflexión-1 supera a los modelos en la misma clase de cómputo, definidos como modelos entrenados utilizando en la mayoría de los fracasos (operaciones de punto flotante) de Palm-540b.

El éxito de la inflexión-1 y la rápida escala de la infraestructura informática de la compañía, impulsada por la ronda de financiación sustancial, resaltan la inquebrantable dedicación de la IA para entregar su misión de crear una IA personal para todos. Con la integración de la inflexión-1 en PI, los usuarios ahora pueden experimentar el poder de una IA personal, beneficiándose de su personalidad empática, utilidad y estándares de seguridad.

Inflexión-2.5

La inflexión-2.5 ahora está disponible para todos los usuarios de PI, el asistente personal de IA de IA de inflexión, en múltiples plataformas, incluida la web (PI.AI), iOS, Android y una nueva aplicación de escritorio. Esta integración marca un hito significativo en la misión de la IA inflexión de crear una IA personal para todos, combinando la capacidad en bruto con sus estándares de seguridad empáticos y de seguridad.

Un salto en el rendimiento de la inflexión de inflexión AI, la inflexión-1, utilizó aproximadamente el 4% de los fracasos de entrenamiento (operaciones de punto flotante) de GPT-4 y exhibió un rendimiento promedio de alrededor del 72% en comparación con GPT-4 en varios IQ orientados tareas. Con la inflexión de 2.5, la IA de inflexión ha logrado un impulso sustancial en las capacidades intelectuales de PI, con un enfoque en la codificación y las matemáticas.

El rendimiento del modelo en los puntos de referencia de la industria clave demuestra su destreza, que muestra más del 94% del rendimiento promedio de GPT-4 en varias tareas, con un énfasis particular en sobresalir en las áreas STEM. Este notable logro es un testimonio de la inflexión del compromiso de IA de impulsar la frontera tecnológica mientras se mantiene un enfoque inquebrantable en la experiencia y la seguridad del usuario.

La codificación y la destreza en las matemáticas inflexión-2.5 brilla en la codificación y las matemáticas, lo que demuestra una mejora del 10% en la inflexión-1 en el big-bench-dard, un subconjunto de problemas desafiantes para modelos de idiomas grandes. Dos puntos de referencia de codificación, MBPP+ y Humaneval+, revelan mejoras masivas sobre la inflexión-1, solidificando la posición de la inflexión-2.5 como una fuerza a tener en cuenta en el dominio de codificación.

En el punto de referencia MBPP+, la inflexión-2.5 supera a su predecesor por un margen significativo, exhibiendo un nivel de rendimiento comparable al de GPT-4, según lo informado por Deepseek Coder. Del mismo modo, en el punto de referencia Humaneval+, la inflexión-2.5 demuestra un progreso notable, superando el rendimiento de la inflexión-1 y se acerca al nivel de GPT-4, como se informó en la tabla de clasificación Evalplus.

Dominio de referencia de la industria

La inflexión-2.5 se destaca en los puntos de referencia de la industria, mostrando mejoras sustanciales sobre la inflexión-1 en el punto de referencia MMLU y el punto de referencia GPQA Diamond, famoso por su dificultad de nivel experto. El rendimiento del modelo en estos puntos de referencia subraya su capacidad para manejar una amplia gama de tareas, desde problemas a nivel secundario hasta desafíos a nivel profesional.

Excelente en los exámenes STEM, la destreza del modelo se extiende a los exámenes STEM, con un rendimiento destacado en el examen de matemáticas húngaras y la física GRE. En el examen de matemáticas húngaras, la inflexión-2.5 demuestra su aptitud matemática al aprovechar el aviso y el formateo de pocos disparos proporcionados, lo que permite facilitar la reproducibilidad.

En la física GRE, un examen de ingreso de posgrado en Física, la inflexión-2.5 alcanza el percentil 85 de los examinados humanos en Maj@8 (votación mayoritaria a los 8), solidificando su posición como un contendiente formidable en el ámbito de los problemas físicos. . Además, el modelo se acerca al puntaje superior en Maj@32, exhibiendo su capacidad para abordar problemas de física complejos con una precisión notable.

Mejorar la experiencia del usuario inflexión-2.5 no solo defiende los estándares de personalidad y seguridad de la firma de PI, sino que eleva su estado como una IA personal versátil e invaluable en diversos temas. Desde discutir los eventos actuales hasta buscar recomendaciones locales, estudiar para exámenes, codificación e incluso conversaciones casuales, PI impulsado por la inflexión-2.5 promete una experiencia de usuario enriquecida.

Con las poderosas capacidades de Inflection-2.5, los usuarios se comprometen con PI en una gama más amplia de temas que nunca. La capacidad del modelo para manejar tareas complejas, combinada con su personalidad empática y capacidades de búsqueda en la web en tiempo real, asegura que los usuarios reciban información y orientación de alta calidad y actualización.

La adopción y el compromiso del usuario El impacto de la integración de la inflexión-2.5 en PI ya es evidente en el sentimiento del usuario, la participación y las métricas de retención. La IA de inflexión ha sido testigo de una aceleración significativa en el crecimiento orgánico de los usuarios, con un millón de usuarios activos diarios y seis millones mensuales que intercambian más de cuatro mil millones de mensajes con PI.

En promedio, las conversaciones con PI duran 33 minutos, con uno de cada diez que dura más de una hora cada día. Además, aproximadamente el 60% de las personas que interactúan con PI en una semana dada regresan la semana siguiente, mostrando una mayor adhesión mensual que los principales competidores en el campo.

Detalles técnicos y transparencia de referencia

En línea con la inflexión del compromiso de IA con la transparencia y la reproducibilidad, la compañía ha proporcionado resultados técnicos y detalles integrales sobre el desempeño de la inflexión-2.5 en varios puntos de referencia de la industria.

Por ejemplo, en la versión corregida del conjunto de datos MT-Bench, que aborda problemas con soluciones de referencia incorrectas y premisas defectuosas en el conjunto de datos original, la inflexión 2.5 demuestra el rendimiento en línea con las expectativas basadas en otros puntos de referencia.

La IA de inflexión también ha evaluado la inflexión-2.5 en Helaswag y Arc-C, puntos de referencia de sentido y ciencias comunes informados por una amplia gama de modelos, y los resultados muestran un fuerte rendimiento en estos puntos de referencia saturantes.

Es importante tener en cuenta que, si bien las evaluaciones proporcionadas representan el modelo que alimenta el PI, la experiencia del usuario puede variar ligeramente debido a factores como el impacto de la recuperación web (no se usa en los puntos de referencia), la estructura de pocas solicitudes y otros Diferencias del lado de la producción.

Conclusión

La inflexión-2.5 representa un salto significativo hacia adelante en el campo de los modelos de idiomas grandes, rivalizando con las capacidades de los líderes de la industria como GPT-4 y Gemini mientras utiliza solo una fracción de los recursos informáticos. Con su impresionante rendimiento en una amplia gama de puntos de referencia, particularmente en áreas STEM, codificación y matemáticas, la inflexión-2.5 se ha posicionado como un contendiente formidable en el paisaje de IA.

La integración de la inflexión-2.5 en PI, el asistente personal de IA de IA, promete una experiencia de usuario enriquecida, que combina la capacidad en bruto con la personalidad empática y los estándares de seguridad. A medida que la IA de inflexión continúa empujando los límites de lo que es posible con LLMS, la comunidad de IA anticipa ansiosamente la próxima ola de innovaciones y avances de esta empresa pionera.

El enfoque visionario de la IA de inflexión se extiende más allá del mero desarrollo del modelo, ya que la compañía reconoce la importancia de la capacitación y el ajuste fino en la creación de experiencias de IA de alta calidad, seguras y útiles. Como un estudio de IA integrado verticalmente, la IA de inflexión maneja todo el proceso interno, desde la ingestión de datos y el diseño del modelo hasta la infraestructura de alto rendimiento.

Los piratas informáticos aprovechan la falla de Metro4Shell RCE en el paquete npm...

Intel (INTC) se acerca a Nvidia y anuncia desarrollo de GPU

Movsar Evloev y Lerone Murphy encabezan la cartelera de UFC Londres de marzo

Inflexión-2.5: The Powerhouse LLM Rivaling GPT-4 y Gemini

Inflexión-2.5

Dominio de referencia de la industria

Detalles técnicos y transparencia de referencia

Conclusión

Artículos más populares

Los piratas informáticos aprovechan la falla de Metro4Shell RCE en el...

Intel (INTC) se acerca a Nvidia y anuncia desarrollo de GPU

Movsar Evloev y Lerone Murphy encabezan la cartelera de UFC Londres...

“El Sucio Sánchez”: Musk intensifica las críticas al presidente español en...

Djokovic sube al tercer puesto; Sabalenka sigue siendo la primera mujer...

EN VIVO AHORA: La Cumbre de la IRF analiza la protección...

Sobre nosotras

Temas

Últimas noticias

Los piratas informáticos aprovechan la falla de Metro4Shell RCE en el...

Intel (INTC) se acerca a Nvidia y anuncia desarrollo de GPU

Movsar Evloev y Lerone Murphy encabezan la cartelera de UFC Londres...

Noticias populares

Microsoft supera la valoración de $ 4 billones después de las...

Alexander Zverev: Los tribunales se desaceleran para ayudar a Sinner, Alcaraz

Jon Jones tiene cargos retirados en caso de que se produzca...