Yoast SEO plugin y el consumo de recursos

Seguramente es otro de esos posts nerdada pero que me generó mucha curiosidad cuando tuve que resolver el problema.

La cuestión es así, un servidor de un amigo que tiene un Wordpress con muchas visitas, entre los famosos plugins de WP hay uno que usan muchos que se llama Yoast SEO que básicamente se encarga de administrar el SEO de cada artículo y componente del sitio.

El plugin funciona muy bien y ayuda a las visitas pero tiene un problemita: jamás fue pensado para un sitio enorme...

Aviso que encontrar esto me llevó un buen rato, por suerte el servidor donde corre el sitio es un VPS con un Ubuntu más o menos bien instalado por quien escribe que tiene acceso a configuraciones extra y logs.

Hace ya tiempo le había configurado en el MySQL el log de Slow Query que sirve para ver cuales de las consultas se está tardando más de la cuenta. Llegué a una en particular que identificaba a Yoast como el principal sospechoso:

SELECT COUNT(P.ID)
FROM wp_posts AS P
LEFT JOIN wp_yoast_indexable AS I
		ON P.ID = I.object_id
		AND I.link_count IS NOT NULL
		AND I.object_type = 'post'
LEFT JOIN wp_yoast_seo_links AS L
		ON L.post_id = P.ID
		AND L.target_indexable_id IS NULL
		AND L.type = 'internal'
		AND L.target_post_id IS NOT NULL
		AND L.target_post_id != 0
WHERE ( I.object_id IS NULL OR L.post_id IS NOT NULL )
		AND P.post_status = 'publish'
		AND P.post_type IN ('post', 'page', 'attachment', 'wpzoom');

Aquí vemos un lindo query en el que sólo quiere contar la cantidad de elementos, un inocente COUNT(P.ID) ¿no? pero miren bien, si no son expertos de SQL (yo no lo soy, sólo un amateur más) hay algo evidente que indica que todo fallará: LEFT JOIN.

El LEFT JOIN es un arma de doble filo, los DBA odian que los DEVs los usemos, tienen razón, son una violación permanente de recursos.

Pero, por si hay un DBA en la sala, démosle algunos números para que vea la enormidad de la consulta.

La tabla wp_posts tiene 132.000 registros aproximadamente, un buen sitio, uno de los grandecitos, pero ¿Y las tablas de Yoast?

En estas se indican materiales que pueden ser indexables y links de cada nota, el plugin te "exige" que para que una nota esté bien de SEO apunte a, al menos, una url externa, una interna y cosas así, todo eso lo va registrando.

En wp_yoast_indexable había 152.000 registros y en wp_yoast_seo_links unos 134.000, es decir, el LEFT JOIN (a groso modo, no exactamente como digo pero para dar una idea) multiplica una cosa con la otra en una gran matriz para poder encontrar los casos en los que sí y en los que no hubo coincidencia. A diferencia del JOIN que sólo cuando hay un acierto se cruza, en el LEFT entra todo.

132k * 152k * 134k = 2.688.576.000 millones, imposible, no? Okey, esto sería si se cruzaran todos con todos y sin índices, aquí por suerte hay algunos, aun así el resultado es una barbaridad enorme de memoria y disco swapeando con el procesador esperando y la tabla wp_posts bloqueada.

BLOQUEADA? No es acaso la tabla principal donde están todas las notas de un sitio? Así es, todos los demás queries se quedaban esperando la liberación, ni hablar si tenían que escribir en las otras dos, así que el sitio arrancaba bien en cada reiniciada de servidor hasta que este query entraba en la cola y chau, adiós servidor.

Ahora bien, estamos hablando de un plugin que utilizan MILLONES de sitios para mejorar su SEO, si te va muy bien empezás a consumir recursos como un desgraciado y no entendés por qué. PORQUE ESTÁ MAL PROGRAMADO!

No encontré a ningún otro quejándose de esto, será que en el primer mundo es barato contratar un VPS cada vez más grande pero en mi caso tuve que limpiar de un sopapo la tabla wp_yoast_seo_links y liberé el CPU. ¿Lo ideal? Cambiar a otro plugin, ahora estoy probando Rank Math SEO a sugerencia de Martín Aberastegue que me dijo que andaba bien y permitía la importación de lo que tengas en YOAST.

PS: por suerte en este blog no uso Wordpress :P ah, eso sí, el SEO del sitio apesta, pero bueno

Si te gustó esta nota podés...
Invitame un café en cafecito.app


Otros posts que podrían llegar a gustarte...

Comentarios

  • Danbat     16/02/2022 - 14:32:23

    Mientras leía cómo explicabas que está mal programado y hace colgar el servidor, iba pensando "podría usarlo para mi blog que anda en Wordpress"

    • Fabio Baccaglioni     16/02/2022 - 15:20:42

      jaja "cómo romper mi propio sitio, Yahoo Respuestas"

  • José Zanni     16/02/2022 - 16:04:06

    ODIO todos esos plugins que usan los genios del SEO... convierten una web que está funcionando mas o menos bien optimizada para lo que es Wordpress en un elefante rengo, tísico, terminal y con rigidez mórbida.

    También muchas veces me da bastante asco Wordpress y esos plugins monstruosos que se usan ahora para hacer cualquier cosa.

    • Fabio Baccaglioni     16/02/2022 - 17:38:01

      están geniales en el sentido de extender la funcionalidad pero muy mal testeados y poco performantes, no puede ser que tengan estas consultas y ni siquiera testeen eso para sitios grandes, una locura.

    • Martin Aberastegue     17/02/2022 - 10:59:37

      Coincido, hay que minimizar la máximo el uso de plugins, porque entre eso y los themes mal programados a la larga, todos los sitios terminan siendo un desastre con el consumo de recursos. Cuando no hay recursos, y no queda otra, Rank Math es una buena alternativa, sino siempre va a ser mejor algo integrado al theme directamente, y personalizado para el sitio.

  • No Tengo     16/02/2022 - 22:27:12

    José Zanni dijo:

    ODIO todos esos plugins que usan los genios del SEO... convierten una web que está funcionando mas o menos bien optimizada para lo que es Wordpress en un elefante rengo, tísico, terminal y con rigidez mórbida.

    También muchas veces me da bastante asco Wordpress y esos plugins monstruosos que se usan ahora para hacer cualquier cosa.



    Yo sigo sin entender elementor o esos editores que te solucionan la vida, no LOS entiendo me vuelven loco

  • Fco Javier     16/02/2022 - 23:20:17

    Has usado The SEO Framework?

  • Juan     18/02/2022 - 12:34:53

    Por cada Left /Right Join sacrificamos un cachorro de Panda.
    Por cada Consulta a la Base sin optimizar, te meamos en la tasa de café
    (este es un mensaje patrocinado por su DBA Team de confianza).

  • German     18/02/2022 - 14:26:45

    ...
    132k * 152k * 134k = 2.688.576.000 millones, imposible, no?
    ...

    Te estás confundiendo con un cross join. No son tantas las combinaciones en este caso. Tal vez acá alcanza con usar exists en lugar de los joins. Hay que ver para que usa la cantidad calculada.

    • Fabio Baccaglioni     18/02/2022 - 15:29:05

      creo que la usa para indicar en cuántos otros posts está linkeado, por eso recorre todo para analizar los enlaces internos y/o externos. Tiene que hacer una pasada por toda wp_yoast_seo_links pero antes cruzar con toda wp_yoast_indexable para ver en cuales. Para mi no debería resolverse con LEFT JOIN y hasta por ahí con una subconsulta acelerás el proceso sin bloquear que, al fin y al cabo, era el problema

  • Natalia     25/01/2024 - 12:32:25

    Hola! Cómo te fue con el Rank Math? yo estoy evaluando el mismo problema en n uestra db pero con la tabala wp_options y estoy sospechando del Rank!...me serviría mucho saber tu experiencia! gracias!

    • Fabio Baccaglioni     25/01/2024 - 16:22:20

      bastante bien! no me voltea el servidor para nada, fue un parto la migración de datos de uno al otro (chocaba con otro plugin, W3 Total Cache que también saqué y puse otro) y funcionó bastante bien, en tecnogeek.com sigo usándolo

  • padel     07/02/2024 - 15:14:56

    Hola.

    Yo uso Yoast, puedo borrar las tablas para ahcer limpieza o va a dar problemas de funcionalidad o se va a borrar algo de informacion importante?

    tengo 19.000 entradas en wp_yoast_seo_links

    y 16.000 en wp_yoast_indexable

    estoy limpiando toda la web, pero hay cosas que no me atrevo a borrar y no encuentro mucha informacion

    • Fabio Baccaglioni     07/02/2024 - 18:59:02

      pero para qué querés borrar? esos números son re manjeables, super bajos, no deberían afectar el funcionamiento de nada, el problema se da cuando tenés diez o veinte veces esas cantidades

Deje su comentario:

Tranquilo, su email nunca será revelado.
La gente de bien tiene URL, no se olvide del http/https

Negrita Cursiva Imagen Enlace


Comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador. Los comentarios son filtrados por ReCaptcha V3.