Selección de subconjuntos para regresión por optimización 

Selección de subconjuntos para regresión por optimización

En el contexto de la optimización de motores de búsqueda (SEO),
la regresión lineal múltiple no funciona realmente por dos razones.
Primero, la regresión lineal asume que la variable dependiente
(en este caso, el rango del sitio) se mide en una escala de intervalo.

| www.GustavoGuardadoRoa.com |

Costa Rica (506) 8322-2771 - seoanddesign @ gmail.com


sitios en la web facebook costa ricatwitter costa ricapinterest costa ricalinkedin costa ricayoutube costa ricamix sitios en la web costa ricatumblr sitios en la web costa ricainstagram sitios en la web costa ricagoogle my business sitios en la web costa rica

marketing digital

 

En segundo lugar, la regresión lineal asume una relación de línea recta, donde en realidad algunas variables son buenas, hasta cierto punto y luego son malas, la línea sería curva.

Wikipedia define un análisis de regresión como "un proceso estadístico para estimar las relaciones entre variables". En pocas palabras, un análisis de regresión puede decirle cómo una variable afecta a otra variable. En este análisis, la primera variable se denomina "variable independiente" y la segunda se denomina acertadamente "variable dependiente". En la regresión múltiple, puede agregar tantas variables independientes como desee y ver cuáles, si las hay, afectan a esta variable dependiente y en qué medida. Esta es la base para el siguiente análisis SEO .

¿Qué hay en las técnicas de optimización de páginas?

Las técnicas de SEO técnicas de SEO en la página deben ejecutarse junto con las técnicas de SEO y las tácticas de SEO fuera de la página para obtener los mejores y más duraderos resultados. Algunas de las técnicas de SEO en la página más conocidas incluyen URL, enlaces internos, etiquetas de título y meta, actualización de contenido.

¿Cómo hago en optimización de páginas SEO?

Siga estos 8 consejos de SEO en la página.

  • 1. Entra en el juego optimizando la "intención de búsqueda".
  • 2. Asegúrese de que su página se cargue RÁPIDO.
  • 3. Coloque estratégicamente su palabra clave objetivo en el título, la meta descripción y las etiquetas H1.
  • 4. Utilice URL descriptivas breves.
  • 5. Utilice etiquetas alt descriptivas para las imágenes (y optimice los nombres de sus archivos de imagen).
  • 6. Utilice el marcado de esquema (cuando corresponda) para aumentar el CTR.
  • 7. Aumentar la "relevancia temática" para facilitar las cosas a Google.
  • 8. Mantenga su contenido simple y legible.

¿Por qué es importante la optimización de la página?

La optimización en la página le ayuda a posicionarse bien en los motores de búsqueda y también ayuda a mejorar la legibilidad general de su sitio web para sus usuarios. La optimización en la página es muy esencial para ganar visibilidad en los resultados de búsqueda, ya que sin optimizar sus factores en la página, no lo encontrarán en los motores de búsqueda.

¿Qué es un buen ranking SEO?

¿Cuáles son los factores de clasificación SEO más importantes?

  • - Un sitio web seguro y accesible.
  • - Velocidad de página (incluida la velocidad de página móvil)
  • - Amabilidad móvil.
  • - Edad, URL y autoridad del dominio.
  • - Contenido optimizado.
  • - SEO técnico.
  • - Experiencia de usuario (RankBrain)
  • - Enlaces.


Desde que estoy en Sitios en la Web, he estado haciendo optimizaciones en la página para los sitios web de los clientes de manera constante. Inicialmente, crearíamos informes ornamentados que instruyeran a los clientes sobre cómo realizar cambios por sí mismos y dónde aparecerían estos cambios en la página. Finalmente, pasamos a la solución más llave en mano de hacer los cambios nosotros mismos. Con este cambio vino un cierto sentido de responsabilidad. No solo para asegurarnos de no romper los sitios web de los clientes, sino también para realizar un seguimiento de lo que se cambió para que podamos demostrar nuestro éxito (generalmente visto en las clasificaciones de palabras clave).

Debido a que somos bastante eficientes al realizar estos cambios en los sitios web, es muy raro que un cliente pregunte exactamente sepa qué se cambió y cómo. Esto me hizo preguntarme con qué propósito estábamos compilando esta gran base de datos de registros de optimización de páginas.Creo que fue una reunión de planificación estratégica hace casi un año cuando presenté por primera vez la idea de usar estos datos junto con nuestras herramientas que rastrean el rendimiento actual de las palabras clave para construir algún tipo de predicción de clasificación. Idealmente, el equipo de ventas podría utilizar esta herramienta para dar a los clientes una buena suposición sobre el aumento de su visibilidad de forma orgánica dadas sus métricas específicas (espacio competitivo, autoridad de dominio, CMS, etc.).

Desde entonces, aprendí sobre el poder de la regresión simple y múltiple y lo útil que se puede predecir es una variable dependiente, como la mejora de la clasificación de palabras clave. El primer paso fue averiguar qué datos teníamos y qué era relevante. Para cada cliente, tenemos la palabra clave optimizada, la clasificación de esa palabra clave en ese momento, la página modificada y el número de cambios que consideramos apropiado realizar.

Dada esta palabra clave, podría hacer referencia a Google Ads para encontrar tanto el volumen de búsqueda mensual promedio como la competitividad. Normalmente no tomo los volúmenes de búsqueda de Google Ads al pie de la letra y sospecho igualmente de su medida de competitividad, pero pensé que todas las palabras clave elegidas probablemente tenían el mismo sesgo, siempre que obtuviera las estimaciones de búsqueda de Google para cada una y seleccionara las palabras clave de popularidad similar.

Entonces, después de compilar un grupo de aproximadamente seis clientes (y aproximadamente 100 observaciones), extraje los datos de clasificación actuales y calculé las variables de mejora (init.rank - curr.rank). Esta métrica de mejora sería mi variable dependiente en la que el análisis de regresión intentaría explicar mediante la combinación de mis variables independientes.

Mi siguiente paso fue decidir qué variables incluir en mi regresión. Inicialmente pensé que agregar una variable booleana para connotar si la página era una página de inicio sería valioso porque, por lo general, las páginas de inicio tienden a tener la mayor cantidad de enlaces y, por lo tanto, la mayor autoridad de página en cualquier sitio dado. Incluí esto, la autoridad de dominio del sitio, el volumen de búsqueda de palabras clave, la competitividad de la palabra clave, el número de cambios realizados en la página y la clasificación inicial de la palabra clave en el momento de la optimización en la regresión y dejé que SPSS hiciera el trabajo. SPSS es un programa estadístico informático muy usado en las ciencias sociales y aplicadas, además de las empresas de investigación de mercado.

La primera métrica que miré fue el valor R cuadrado ajustado. El .230 significa que la siguiente regresión de las variables independientes representó el 23% de la variación en la mejora del ranking de palabras clave. Esto no parece genial, pero de lo que he aprendido jugando con conjuntos de datos del mundo real es que muchas veces no se puede explicar todo. Sin embargo, pensé que el 77% sin explicación dejaba una buena cantidad que desear, así que pensé en cómo hacer que mis datos fueran más lógicos.

Hubo casos (solo algunos) en los que una palabra clave empeoró después de la optimización de la página. Quizás esta palabra clave se volvió más competitiva o no era relevante para el sitio web. De cualquier manera, Pensé que una mejora negativa confundiría a SPSS y si iba a asumir que la optimización de la página produciría una mejora en la clasificación (que creo que todos podemos asumir), entonces solo debería seleccionar los casos en los que la mejora es mayor que 0.

También me concentré en intentar simplificar mis variables independientes. La figura R-Cuadrada ajustada lo penaliza un poco por incluir demasiadas variables en un intento de explicar todos los aspectos de su variable dependiente. En pocas palabras, cuantas menos variables muy relevantes retroceda, mayor será su R-cuadrado ajustado y, por lo tanto, más sentido tendrá su regresión.

Entonces, dado que esta herramienta se usaría principalmente para ventas, pensé que eliminaría algunas variables que pueden no inferirse fácilmente sin acceso a los sitios de un cliente potencial (el número de variables cambió). También pensé que si bien es interesante observar el efecto de la página de inicio en la mejora, esto generalmente está sesgado porque las páginas de inicio generalmente ya tienen una clasificación fuerte y, por lo tanto, la mejora es marginalmente menor.

Así que ejecuté otra regresión, con menos casos (solo mejoras positivas de las páginas que no son de inicio) y variables (volumen de búsqueda de palabras clave, competitividad, autoridad de dominio y clasificación inicial) y obtuve los siguientes resultados.

Como puede ver, ahora estoy explicando el 53, 5% de la variación en la mejora con mis cuatro variables. Nuevamente, no parece nada innovador, pero si puedo explicar aproximadamente la mitad del algoritmo de clasificación de Google con cuatro variables, lo llamaré una victoria. Lo siguiente que debe observarse es el estadístico F (13.084) y el estadístico T de las variables individuales. Verá que el estadístico F es lo suficientemente grande como para demostrar que esta regresión es significativa con un 95% de confianza dado el sig. de menos de .05.

Sin embargo, de las variables y la intersección, solo el rango de palabra clave inicial es una variable independiente significativa. Esto podría deberse a muchas cosas: tal vez el tamaño de mi muestra no sea lo suficientemente grande o tal vez haya algo de multicolinealidad dentro de las variables. La multicolinealidad ocurre cuando tienes múltiples variables que explican aspectos que son demasiado similares a las variables dependientes. Por tanto, SPSS no sabe cuál de las variables está causando el impacto.

En cualquier caso, es necesario introducir más datos para explorar más. Mientras tanto, creo que esta es una práctica interesante para aprender qué variables afectan nuestro objetivo final como empresa de SEO. Un análisis de SEO como este es útil para cuantificar realmente la importancia de los cambios que hace nuestro equipo en el sitio web de un cliente. También sirve como un buen ejemplo de cómo puede convertir la carga de datos extraños en una herramienta útil a través del análisis de regresión.

Análisis de regresión para SEO

Google insiste en que no hay forma de "superar" sus algoritmos de búsqueda. El hecho es que estos algoritmos no son más que ecuaciones matemáticas que tienen hilos en común. Por supuesto, son algoritmos muy complejos con cientos de años de horas de trabajo que se han invertido en ellos. Sin embargo, métodos estadísticos que nos permiten aproximar una ecuación desconocida con una ecuación similar. Esta publicación de blog desglosará algunos métodos estadísticos que Fruition utiliza para mejorar el SEO de nuestros clientes.

Lo importante primero

Los modelos estadísticos de Fruition nos dicen que varias variables conocidas siguen siendo importantes. Esos son:

  • - Etiquetas H1,
  • - la importancia, el formato y la densidad de las etiquetas de título cambian mucho para las diferentes búsquedas,
  • - el tráfico del sitio es importante y
  • - la optimización excesiva del texto de anclaje es un asesino.

Esos, por supuesto, son solo algunos de los detalles que conocemos. Los siguientes párrafos sientan las bases de cómo llegamos a hacer esas declaraciones.

Regresión lineal para SEO

La versión más limitada y de fácil comprensión de este método es la regresión lineal. En la regresión lineal encontramos la "mejor" línea a través de los datos. Esencialmente, encontramos la línea que pasa más cerca de todos los puntos en un conjunto de datos simultáneamente. La regresión lineal generalmente se enseña como un curso universitario de primer año.

Aquí en Fruition hemos estado utilizando modelos estadísticos avanzados para enfocar los presupuestos de SEO de nuestros clientes en las variables que podemos impactar y producir el impacto positivo más probable en las clasificaciones. Algunas de las cosas que han descubierto nuestros modelos estadísticos son la optimización excesiva del texto de anclaje y la mayor importancia de las redes sociales y la velocidad de la página en la clasificación de un sitio web. Esta publicación de blog explica algunas estadísticas de nivel básico e intermedio que puede aplicar a sus esfuerzos de marketing de búsqueda.

La Figura 1 muestra los resultados de un análisis de regresión simple realizado usando SAS. La línea representa la mejor línea disponible a través de todos los datos. Observe cómo la línea no está muy cerca de muchos de los puntos que representa. Esto se debe a un mal ajuste. En la tabla “R-Cuadrado” = 0.1103. El valor de R cuadrado indica que esta línea representa solo el 11,03% de la variabilidad en los puntos de datos. Esperamos un valor más cercano a 1, lo que indicaría un ajuste casi perfecto. Buscamos alrededor de .3 como regla general, ya que los valores entre .05 y .2 pueden indicar que no hay ninguna relación.

En SEO, todos estamos de acuerdo en que hay más de una variable que determina la clasificación general de un sitio. Las regresiones lineales múltiples nos permiten agregar más variables predictoras. Con más variables surgen nuevos problemas. Necesitamos que la variable sea independiente entre sí (de lo contrario, podemos encontrar un valor alto de R cuadrado debido a la superposición de variables). La línea ahora viaja a través del "espacio n" ya no es la línea una cosa bidimensional que se muestra en el papel. Más bien para cada variable, hay otra dimensión. Para 3 variables, la línea estaría en 3-D. Pero para más de tres es difícil entender cómo "se ve" la línea.

Regresión lineal múltiple para SEO

En el contexto de la optimización de motores de búsqueda (SEO), la regresión lineal múltiple no funciona realmente por dos razones. Primero, la regresión lineal asume que la variable dependiente (en este caso, el rango del sitio) se mide en una escala de intervalo. En segundo lugar, la regresión lineal asume una relación de línea recta, donde en realidad algunas variables son buenas, hasta cierto punto y luego son malas, la línea sería curva.

Los datos de intervalo significan que la distancia entre la primera y la segunda variable clasificada es la misma que la distancia entre la cuarta y la quinta variable, etc. Como ejemplo, considere cómo medimos la altura, una persona de seis pies es más alta que una persona de cinco pies por el mismo distancia como una persona de cinco pies es más alta que una persona de cuatro pies, todas las pulgadas tienen la misma longitud. El rango del sitio se mide solo en una escala ordinal, donde el primero es mejor que el segundo y así sucesivamente, pero no se sabe nada acerca de la distancia entre ellos. El mejor ejemplo de ordinal es el nivel educativo, sabemos que un JD requiere más estudio que un MS, sin embargo, ¿es la distancia entre un JD y un MS la misma que la distancia entre un BS y un MS? Puedo dar fe de que no lo es. Aplicado al mundo del SEO,la distancia entre la cantidad de enlaces construidos y la calidad del contenido en el sitio no es para sitios que están clasificados de la posición 1 a 2 y 2 a 3, etc.

La forma de la relación entre las variables predictoras y las variables dependientes establece si una variable cambia (el rango real del sitio es la variable dependiente y las otras variables como el recuento de palabras clave son los predictores). Por ejemplo, el tipo de spam más fácil de detectar es tener la palabra clave en una página web 100.000 veces. Un recuento de palabras clave de 100.000 es demasiado, pero no tener la palabra clave en absoluto también es malo. En algún lugar entre 0 y 100.000 encontramos un buen lugar para muchas variables. La Tabla 2 muestra un ejemplo simple de una relación curvilínea. En el ejemplo, observe que R² = .2093, que no es horrible, pero mire los puntos. Existe una relación clara, pero no es una línea recta, por lo que la regresión lineal no puede encontrarla.

Regresión logística para SEO

Pasamos ahora a un modelo más apropiado. La regresión logística en sí misma resuelve el primer problema con la regresión lineal aplicada al SEO. La regresión logística no asume que los datos se miden en una escala de intervalo. Este único cambio trae consigo otros cambios en la forma en que se interpretan los resultados y la información que podemos derivar del modelo. La regresión logística está impulsada por un concepto llamado razón de probabilidades. Las probabilidades son simplemente la razón de la probabilidad de éxito dividida por la probabilidad de fracaso. Aquí el éxito y el fracaso simplemente se refieren a conseguir lo que busca. En una carrera de caballos, las probabilidades de un caballo dado son la probabilidad de que el caballo gane, dividida por la probabilidad de que pierda. Entonces, las probabilidades de 3: 1, o solo 3, indican que el caballo tiene tres veces más probabilidades de ganar que de perder.

Razón de probabilidades

Una razón de probabilidades es la probabilidad de que una variable esté en una categoría dividida por las probabilidades de que la misma variable esté en la siguiente categoría inferior. Una razón de probabilidades (Θ) de uno indica que la variable tiene la misma probabilidad de caer en cualquier categoría. Θ <1, indica que es más probable que la variable se encuentre en la categoría inferior, y Θ> 1 indica que es más probable que la variable se encuentre en la categoría superior. En el contexto del SEO, esto es útil porque podemos dividir las clasificaciones en categorías; digamos los 20 resultados principales, los 20 resultados siguientes y así sucesivamente para los 100 primeros. Luego, podemos mirar varias variables y ver si la razón de probabilidades de una variable dada se presta a mejorar el rango.

Problemas con la regresión lineal para SEO

El segundo problema con la regresión lineal para SEO es más difícil de abordar. Cada variable debe analizarse individualmente para que su forma se pueda determinar manualmente. Una vez que se conoce la forma, avanzamos observando valores que sean demasiado grandes o demasiado pequeños.
Encontrar malas variables

Aplicado a la regresión logística de SEO, es un método útil para descartar variables incorrectas. El truco es que, como todo análisis de regresión, la regresión logística es un estudio correlacional, lo que significa que los resultados nunca pueden decir qué variables realmente hacen que el rango mejore; simplemente podemos ver qué variables están relacionadas con el rango. Las variables reales que hacen que el ranking mejore son las variables que mide Google. Ahora podemos intentar establecer una lista de variables para aproximarnos al algoritmo de Google. El problema restante es que muchas de las variables disponibles están estrechamente relacionadas entre sí.

Publicación de blog futura sobre cómo utilizar el análisis de regresión para SEO

En las próximas publicaciones del blog, desglosaré cómo descubrimos qué variables son útiles para trabajar y cuáles están simplemente relacionadas estrechamente con las variables que realmente afectan el ranking de un sitio web en Google o Bing. Aquí en FRUITION, utilizamos estos datos para enfocar nuestro trabajo de SEO en los sitios web de los clientes para maximizar su presupuesto. Si dedica tiempo (que es solo el dinero del cliente) trabajando en variables que están fuera de su alcance o que producen un impacto mínimo, simplemente está desperdiciando el dinero. Es muy similar a pujar por las palabras clave adecuadas. Con el SEO de Fruition, estás asignando efectivamente tu presupuesto de SEO a las variables adecuadas que tienen más probabilidades de producir un retorno positivo en la clasificación del sitio, por lo tanto, clientes potenciales o ventas.

Gustavo Guardado Roa

Te ofrecezco desarrollar tu proyecto web de forma profesional.
Tengo a tu disposición diversas opciones atractivas.

 

Publicar un comentario

Nota: Los Campos marcados con un * son obligatorios.

Nombre:

Apellidos:

E-mail:

Comentario:

"Asegurate de colocar la dirección de tu correo electrónico, de lo contrario, no podremos evacuar tus preguntas, consultas o saber quién comenta"

blank space




Bueno, te preguntarás ¿Quién es la persona que te brinda estos consejos técnicos?, pues es quien te ha estado enviando contenidos de SEO, SEM, SMO, Web and Graphic Design. Sí, esta es mi foto y mi nombre es Gustavo Guardado Roa y soy tu anfitrión en el recorrido de este sitio en la web, mi idea es asistirte en el proceso de hacer tu página web y del como tener un ingreso con el buen uso del marketing en la internet y las mejores aplicaciones.

gustavo guardado roa
Gustavo Guardado Roa
Consultor Marketing Digital y SEO
Leer mas

posicionamiento web en costa rica
chatbot costa rica
Chatbot Costa Rica

posicionamiento web en costa rica
Inscríbete a nuestro Boletín Electrónico
Recibí consejos GRATIS sobre las
últimas noticias de Marketing Digital.

posicionamiento web en costa rica
¿Qué es SEO?

que es seo
Bajar PDF- -> SEO vs PPC

posicionamiento web en costa rica WhatsApp SEO Costa Rica

posicionamiento web en costa rica

seo costo
Presios SEO

Permitínos mejorar tus
resultados de marketing en línea.
Hemos aumentado el tráfico,
los clientes potenciales y
las ventas de compañías en
turismo, bienes raíces, medicina.
Además, para cientos de pequeñas
empresas locales como dentistas,
veterinarios, fontaneros, dermatólogos, etc.

posicionamiento web en costa rica

Posicionamiento internacional a través de SEO

Compartí este
artículo por Whatsapp

posicionamiento web en costa rica

SEO Costa Rica MAPA


posicionamiento web en costa rica

Ubica tu e commerce y mejora tus ventas con F-Commerce
Ubica tu e commerce ...


posicionamiento web en costa rica

Consejos para la construcción de enlaces ¡Sea natural!
Consejos para ...


posicionamiento web en costa rica

Estrategia de backlinks preparada para el futuro
Estrategia de ...


posicionamiento web en costa rica

Cómo encontrar keywords de alta clasificación y conversión
Cómo encontrar ...


posicionamiento web en costa rica

¿Qué es un lead en marketing digital y para que sirve?
¿Qué es un lead ...


posicionamiento web en costa rica

Prácticas de precios para su agencia de marketing digital
Prácticas de ...


posicionamiento web en costa rica

Señales para reevaluar sus estrategias de marketing digital
Señales para ...


posicionamiento web en costa rica

Diferenciá tu tienda en línea
Diferenciá tu ...


posicionamiento web en costa rica

¿Cómo hacer SEO para nichos específicos?
¿Cómo hacer SEO ...


posicionamiento web en costa rica

Señales rojas de una mala empresa en SEO y marketing digital
Señales rojas ...


posicionamiento web en costa rica

Está generando suficientes clientes potenciales a partir de SEO
Está generando ...


posicionamiento web en costa rica

Cómo los equipos de ventas prosperan en un mundo digital
Cómo los ...


posicionamiento web en costa rica

Estrategias de Inbound Marketing Costa Rica
Estrategias ...


posicionamiento web en costa rica

Estructurando una estrategia de SEO local para su negocio
Estructurando...


posicionamiento web en costa rica

Creando contenido efectivo para tu marca o negocio
Creando contenido...


posicionamiento web en costa rica