HoundDog.ai ayuda a los desarrolladores a prevenir la fuga de información personal

HoundDog.ai, una startup que ayuda a los desarrolladores a asegurarse de que su código no filtre información personalmente identificable (PII), salió del modo sigiloso el miércoles y anunció una ronda de financiación inicial de $3.1 millones liderada por E14, Mozilla Ventures y ex/ante, además de varios inversores ángeles. A diferencia de otras herramientas de escaneo, HoundDog realmente examina el código que un desarrollador está escribiendo, utilizando tanto la coincidencia de patrones tradicionales como modelos de lenguaje grande (LLM) para encontrar posibles problemas.

HoundDog fue fundado por Amjad Afanah, quien anteriormente co-fundó DCHQ, que luego fue adquirida por Gridstore (que, para complicar las cosas, luego cambió su nombre a HyperGrid) en 2016. Afanah también co-fundó apisec.ai, que aún está en funcionamiento, y trabajó en la startup de autos autónomos Cruise. La inspiración para HoundDog llegó durante su tiempo en la startup de seguridad de datos Cyral y hablando con los equipos de privacidad allí, me dijo.

Créditos de la imagen: HoundDog.ai

“Cuando estaba en Cyral, teníamos muchos datos”, dijo. “Lo que hace Cyral, al igual que muchos otros en el espacio de seguridad de datos, es que se enfocan en los sistemas de producción. Te ayudan a descubrir, clasificar tus datos estructurados y tus bases de datos, y luego te ayudan a aplicar controles de acceso. Pero el comentario abrumador que seguía escuchando tanto de los equipos de seguridad como de privacidad era: ‘Sabes, es un poco reactivo y no se mantiene al día con los cambios en la base de código.’”

Por lo tanto, HoundDog lleva este proceso aún más a la izquierda. Aunque todavía se encuentra en el flujo de integración continua y aún no en el entorno de desarrollo (aunque eso puede suceder en el futuro), la idea aquí es encontrar posibles filtraciones de datos antes de que se fusione el código. Y lo más importante, HoundDog lo hace mirando el código real, no el flujo de datos que produce. “Nuestra fuente de verdad es la base de código”, dijo Afanah.

Créditos de la imagen: HoundDog.ai

Gracias a esto, si un equipo de desarrollo comienza a recolectar números de Seguro Social, por ejemplo, HoundDog levantaría una alerta y advertiría al equipo sobre eso antes de que se fusione el código; también alertaría al equipo de seguridad. Eso podría ser potencialmente un problema importante — y costoso — después de todo.

El servicio actualmente admite código escrito en Java, C#, JavaScript y TypeScript, así como consultas SQL, GraphQL y OpenAPI/Swagger. La empresa dice que el soporte para Python es inminente.

Afanah señaló que una herramienta como esta está volviéndose especialmente importante en esta era de código generado por IA, algo que el CEO de Replit (e inversor ángel de HoundDog) Amjad Masad también recalcó.

“A medida que un número creciente de empresas recurren al código generado por IA para acelerar el desarrollo, incrustar las mejores prácticas de seguridad y garantizar la seguridad del código generado se vuelve esencial”, dijo Masad. “HoundDog.ai está liderando el camino en asegurar datos PII temprano en el ciclo de desarrollo, lo que lo convierte en un componente indispensable de cualquier flujo de trabajo de generación de código de IA. Esta es la razón por la que decidí invertir en esta empresa.”

Pero HoundDog también utiliza IA. Actualmente se basa en los modelos de OpenAI para hacerlo, pero es importante enfatizar que esto es opcional. Los usuarios que se preocupan por que su código salga de sus repositorios privados también pueden optar por confiar solo en el escáner de código más tradicional de la empresa.

Una parte importante de la propuesta de valor de HoundDog es que puede reducir los costos de cumplimiento para las startups gracias a sus capacidades de informes automatizados. El servicio puede generar automáticamente un registro de actividades de procesamiento (RoPA). Para hacer esto, HoundDog utiliza IA generativa para generar estos informes y envía esos datos a OpenAI. El equipo destaca que solo los tokens que el servicio ha descubierto a través de su escáner regular son compartidos con OpenAI y que el código fuente real no se comparte.

La empresa ofrece un plan gratuito limitado, con planes pagos que comienzan en $200 al mes para escanear hasta dos repositorios.