Me preguntan seguido cómo hago para manejar la avalancha de nuevos modelos/capacidades/evals/buzzwords en IA. Este post responde a eso.
Considerar que mi foco está en cosas que tengan una aplicación relevante e inmediata en la industria, lo que significa que debería haber un modelo que pueda correr, una API que pueda llamar o algo del estilo. No me interesa mantenerme al día con los desarrollos académicos; si lo que necesitás es mejorar tu ratio señal/ruido en arXiv este post no te va a servir mucho.
X.com, la app para todo, debería ser tu principal fuente de noticias. Toda la gente relevante en este espacio está ahí haciendo anuncios, discutiendo cosas o simplemente shitposteando. No tengo una lista definitiva de a quién seguir, pero si seguís las cuentas de abajo el algoritmo debería ir curando tu timeline con el tiempo.
En ningún orden en particular:
- @giffmana
- @main_horse
- @AlpinDale
- @skalskip92
- @tomaarsen
- @menhguin
- @Dorialexander
- @willccbb
- @_xjdr
- @Tim_Dettmers
- @casper_hansen_
- @vikhyatk
- @ggerganov
- @RisingSayak
- @jeremyphoward
- @jobergum
- @charles_irl
- @wightmanr
- @mervenoyann
- @rasbt
- @karpathy
- @HamelHusain
- @kalomaze
Dependiendo de tu enfoque, r/StableDiffusion (generación y edición de imágenes) y r/LocalLlama (LLMs y VLMs) son subreddits muy buenos para seguir. Suelen enfocarse en modelos más chicos que se pueden correr en consumer hardware, herramientas y librerías, finetunes, etc., aunque últimamente también empezaron a permitir discusiones sobre modelos comerciales (sin open weights).
Solo estoy suscrito a un newsletter. smol.ai junta noticias de varias fuentes (incluido Discord) y te manda un mail todos los días de semana, lo cual es genial si no tenés tiempo para X o Reddit.
Con estas fuentes, muy rara vez me pierdo algún desarrollo nuevo.