Comunidad de diseño web y desarrollo en internet online

Como se determinan los Posts Destacados en Cristalab

Ir a página 1, 2  Siguiente

Foros de discusión > Charla

Citar            
MensajeEscrito el 03 Feb 2012 08:31 pm
En el lanzamiento de Cristalab V4.5 se incluyo un modelo lineal para determinar los posts destacados, lo pueden notar en la portada que es el primer articulo y aparece como una imagen de fondo (efecto hecho por freddier). Además, en el blog al lado derecho.

Para la portada se selecciona el articulo con mayor valor determinado por el modelo en un rango de 7 días, de cualquier tipo de articulo: blog, tutorial y videotutorial. Para el blog se toman 8 articulos de blog en un rango de 60 días.

Los algoritmos tradicionales para destacar un post se basan simplemente en numero de visitas o con un tag de 'destacado' (wordpress creo que lo hace así). Pero en Cristalab no nos conformamos con eso, la cantidad de aportes es increíble (gracias clabers) como para estar etiquetando artículos, y el numero de visitas no me parece el mejor dato para determinar si un post es destacado en un rango de tiempo. Por lo que, decidí crear un modelo lineal para esto.

El modelo lineal que hice toma en cuenta los siguiente datos:

T: tiempo que lleva publicado el articulo.
C: comentarios del articulo.
V: Visitas del articulo.
P: Participantes en el articulo, simplemente cuantos usuarios únicos han comentado.

El modelo es:

Código :

Valor = (V/T) + (C/V) + (P/100)


Si tienen una critica al modelo o pueden mejorarlo, bienvenido sea!

Por Maikel

BOFH

5575 de clabLevel

22 tutoriales
5 articulos

Genero:Masculino   Team Cristalab

Claber de baja indefinida

firefox
Citar            
MensajeEscrito el 03 Feb 2012 08:48 pm
Explicación que todo claber queríamos saber. Gracias por la información.

Por torrealbaruben

Claber

1051 de clabLevel

4 tutoriales

Genero:Masculino  

Front-end developer

chrome
Citar            
MensajeEscrito el 03 Feb 2012 08:59 pm
Tengo una buena idea pero primero una duda: ¿C = 100 comentarios en total y P = 70 usuarios que comentaron varias veces para llegar a C? ¿En que están midiendo T?

Por Kinduff

Claber

3563 de clabLevel

21 tutoriales
3 articulos

 

web dev wizzard

chrome
Citar            
MensajeEscrito el 03 Feb 2012 09:08 pm
Kinduff P <= C

Ejemplo:
T = Tiempo actual - Tiempo de publicación.
C = 100 comentarios en total del articulo.
P = 10 usuarios son los responsables de los 100 comentarios en dicho artículo. Dicho de otra manera, solo 10 personas han participado en los comentarios.

Por Maikel

BOFH

5575 de clabLevel

22 tutoriales
5 articulos

Genero:Masculino   Team Cristalab

Claber de baja indefinida

firefox
Citar            
MensajeEscrito el 03 Feb 2012 09:30 pm
:) es bueno saber como funciona para saber como hacer "SEO" a mis tutoriales :P

Por LeonidasEsteban

Claber

1127 de clabLevel

12 tutoriales
1 articulo

Genero:Masculino  

Front-End de #mejorandola

chrome
Citar            
MensajeEscrito el 03 Feb 2012 09:32 pm

Maikel escribió:

T = Tiempo actual - Tiempo de publicación.

¿Días, Minutos, segundos?

Por Kinduff

Claber

3563 de clabLevel

21 tutoriales
3 articulos

 

web dev wizzard

chrome
Citar            
MensajeEscrito el 03 Feb 2012 09:44 pm
Segundos, unix timestamp

Por Maikel

BOFH

5575 de clabLevel

22 tutoriales
5 articulos

Genero:Masculino   Team Cristalab

Claber de baja indefinida

firefox
Citar            
MensajeEscrito el 03 Feb 2012 09:44 pm
Me parece excelente que trabajes en un algoritmo de eso. Van mis dos centavos. Como lo haria yo.

Tendria un Job corriendo cada noche, que valoraria los articulos. (para en el dia dia ya tener eso procesado y no saturar al server). (conociendote casi firmo que ya tienes ese job, just in case)


Antes de correr el proceso post por post tendria un query para saber que cual es el post que mas visitas a tenido en la semana(now - 7 days)
Z: El MAX( count(visitas) ) a un post entre hoy(now()) y (now - 7 dias)
W: El MAX( count(comentarios) ) a un post entre hoy(now()) y (now - 7 dias)
Y: El MAX( count(personas unicas) ) a un post entre hoy(now()) y (now - 7 dias)

V: Visitas del articulo entre hoy(now()) y (now - 7 dias)
C:Comentarios del articulo entre hoy(now()) y (now - 7 dias)
P: Cantidad de Personas unicas que han comentadio

El modelo es:
Código :
Valor = (V/Z) + (C/W) * (P/Y)


Un post perfecto sumaria 2.

Mi algoritmo no toma en cuenta desde cuando se creo el post lo que le importa es en la semana previa al calculo que articulo fue mas visitado(el mas visitado tiene 1 de valoracion y los demas la parte proporcional a eso) y el mas comentado por personas distintas(el maximo tiene 1), la suma de ambos me da el mas destacado.

El -7 de tiempo, es variable podriamos aumentar el espacio del tiempo.

Por Dano

BOFH

4273 de clabLevel

14 tutoriales
4 articulos
10 ejemplos

Genero:Masculino   Bastard Operators From Hell Premio_Secretos

Lugar estratégico para vigilarte

chrome
Citar            
MensajeEscrito el 03 Feb 2012 09:54 pm
y se toman en cuenta comentario de usuario no registrados ?

Por LeonidasEsteban

Claber

1127 de clabLevel

12 tutoriales
1 articulo

Genero:Masculino  

Front-End de #mejorandola

chrome
Citar            
MensajeEscrito el 03 Feb 2012 10:02 pm

lysergtk escribió:

y se toman en cuenta comentario de usuario no registrados ?


Sí, y por cierto para hacerle un SEO real a tus tutoriales tendrías que aumentar la cantidad de participantes. Además, tienes 7 dias para eso, good luck with that :lol:

Dano: sí tengo un cron job para eso, y además una tabla auxiliar :D Así que por allí estamos bien. Experimentaré con tu propuesta, a ver que tal.

Por Maikel

BOFH

5575 de clabLevel

22 tutoriales
5 articulos

Genero:Masculino   Team Cristalab

Claber de baja indefinida

firefox
Citar            
MensajeEscrito el 03 Feb 2012 10:13 pm
Quizás se tendría que tener en cuenta la reputación del autor, como el clablevel...

Por Sisco

BOFH

3700 de clabLevel

12 tutoriales
4 articulos

Genero:Masculino   Bastard Operators From Hell

Catalunya

safari
Citar            
MensajeEscrito el 03 Feb 2012 10:18 pm
tengo una idea, si fallo una linea de código en el tutorial todos comentaran para trolear y así consigo mas participación... :)

Por LeonidasEsteban

Claber

1127 de clabLevel

12 tutoriales
1 articulo

Genero:Masculino  

Front-End de #mejorandola

chrome
Citar            
MensajeEscrito el 03 Feb 2012 10:37 pm

lysergtk escribió:

tengo una idea, si fallo una linea de código en el tutorial todos comentaran para trolear y así consigo mas participación... :)


Aunque tú lo digas bromeando, otros lo pueden tomar en serio, a eso me refería yo precisamente_..

Por Sisco

BOFH

3700 de clabLevel

12 tutoriales
4 articulos

Genero:Masculino   Bastard Operators From Hell

Catalunya

safari
Citar            
MensajeEscrito el 03 Feb 2012 10:48 pm

Sisco escribió:

Quizás se tendría que tener en cuenta la reputación del autor, como el clablevel...


No, muchos usuarios con clablevel alto solo hacen correcciones ortográficos/gramaticos (editores cof cof, me incluyo lo hice unas veces) en los comentarios del tutorial, ergo, no me sirve como dato valido. Cuando se haga un sistema que valore el aporte del comentario, ese sí se puede tomar en cuenta y jodería lysergtk de una vez, por querer manipular el modelo.

saludos

Por Maikel

BOFH

5575 de clabLevel

22 tutoriales
5 articulos

Genero:Masculino   Team Cristalab

Claber de baja indefinida

firefox
Citar            
MensajeEscrito el 03 Feb 2012 11:12 pm

Maikel escribió:

Sisco escribió:

Quizás se tendría que tener en cuenta la reputación del autor, como el clablevel...


No, muchos usuarios con clablevel alto solo hacen correcciones ortográficos/gramaticos (editores cof cof, me incluyo lo hice unas veces) en los comentarios del tutorial, ergo, no me sirve como dato valido.


:roll: yo no fui XD

en serio, que genial trabajo como siempre maik :) Cuesta acostumbrarse a los cambios en un site que se visita tan seguido (o en el que se vive XD ) pero la portada ahora me parece mas c00l y cómoda con la info :)

Por Mariux

BOFH

7756 de clabLevel

28 tutoriales
15 articulos

Genero:Femenino   Héroes Editores

Diseñadora & ilustradora

chrome
Citar            
MensajeEscrito el 06 Feb 2012 07:00 pm
Creo que Sisco se refiere a tener en cuenta la reputación del Claber autor del post para que influya en qué tan destacado debe ser éste ¿no?

Por ElSiniestro

Claber

285 de clabLevel


1 articulo

Genero:Masculino  

Alguien que Ayuda

chrome
Citar            
MensajeEscrito el 06 Feb 2012 08:06 pm
no se ustedes pero yo haré como andreSOSO para que me comenten un montón :P

Por LeonidasEsteban

Claber

1127 de clabLevel

12 tutoriales
1 articulo

Genero:Masculino  

Front-End de #mejorandola

chrome
Citar            
MensajeEscrito el 06 Feb 2012 08:22 pm
looks like meneame old post, pero interesante :D

Por jesusrlc

4 de clabLevel



 

chrome
Citar            
MensajeEscrito el 06 Feb 2012 08:46 pm
Algunos hablan del clablevel e ingresarlo como variable. No me parece prudente hacerlo... el algoritmo es un muy buen acercamiento. para hacer una buena investigación podrías analizar ambas fórmulas (la diseñada y la propuesta) y revisar sus resultados en off. Con eso podrías hacer una metaevaluación de tus resultados

Por garcosc

Claber

164 de clabLevel

2 tutoriales

Genero:Masculino  

Geek, soñador y docente

chrome
Citar            
MensajeEscrito el 06 Feb 2012 10:20 pm
Bueno Mike,

Yo suelo complicar las cosas pero esto es lo que yo haría:
Utilizando las mis mas variables:

T: tiempo que lleva publicado el articulo.
C: comentarios del articulo.
V: Visitas del articulo.
P: Participantes en el articulo, simplemente cuantos usuarios únicos han comentado.

En primer lugar normalizaría cada variable, utilizando un método como mínimos y máximos,
para llevar a cada variable a un valor entre 1 y 10.

Luego les asignaría importancia en función a tu experiencia como Claber, algo así:

T*(0.6) + C*(0.4) + V*(0.2) + P(0.3)

Tomando en cuenta que mientras mayor sea el multiplicador mas valor tiene esa variable.

Para finalizar podríamos incluir algún indicador del autor, como por ejemplo
el promedio de la valoración de sus últimos 5 Post (puede calcularse con la formula anterior).
Esto porque en teoría un post por un escritor destacado debe ser destacado. Tenemos entonces:

PA: Puntuación últimos post autor

( T*(0.6) + C*(0.4) + V*(0.2) + P(0.3) ) + PA ) / 2

Pudiéramos equilibrar la formula utilizando una constante en caso de que el autor sea
Nuevo

( T*(0.6) + C*(0.4) + V*(0.2) + P(0.3) ) + (PA + 5) ) / 2

Es básicamente un promedio de los post del autor.

XD

Por Juz

0 de clabLevel



 

chrome
Citar            
MensajeEscrito el 07 Feb 2012 09:05 am
Donde esta el botón "Like" cuando se necesita =/ .

Por Otaku RzO

BOFH

1890 de clabLevel

12 tutoriales
1 articulo

Genero:Masculino   Desarrollador de GAIA Bastard Operators From Hell

Lima - Perú

chrome
Citar            
MensajeEscrito el 07 Feb 2012 09:57 pm
Nota: Las opiniones que leerás a continuación no son el resultado del análisis de los comentarios publicados en este post, son mis observaciones personales de lo percibido en el foro.

Con el nuevo enfoque, vemos en portada artículos, tutoriales y videotutoriales por igual. Dado que los artículos se publican en menor cantidad que los tutoriales y videotutoriales pienso que deberían tener más importancia que el resto del material publicado para permanecer mayor tiempo en portada.

Aunque existe una gran probabilidad de que un artículo se convierta en un post destacado, otros artículos pueden quedar sepultados por el constante material publicado. Esto afectaría principalmente a aquellos artículos en los que se anuncian concursos, votaciones, torneos, entre otras actividades propias de la comunidad.

Por otro lado, pienso que también podría considerarse como indicador la cantidad de veces que un usuario señala en facebook que un post le gusta o comparte dicho material. Si alguien comparte un post es porque lo considera realmente bueno en cualquier sentido. Muchas veces los usuarios no dejan comentarios aunque les guste un post, sino que lo comparten o señalan que les gusta en facebook.

Adicionalmente, tengo una inquietud respecto a la duración del post destacado: ¿En la duración no sería conveniente considerar el tipo de material publicado?, ¿cuántos días mínimos permanece un post como destacado? Hace poco rato cambió el post destacado y fue publicado el día 3 de febrero, ¿no les parece muy poco tiempo?. Si fuese un artículo a mí me parecería poco tiempo.

Siguiendo con el tema de los post destacados, pero abordando exclusivamente el ámbito del diseño, considero que irónicamente la frase “post destacado” no destaca mucho. Dada la naturaleza variable de la imagen de fondo de ese post, resulta necesario reconsiderar el diseño de la identificación del mismo. En los fondos con escritos, líneas superiores o imágenes complejas, tiende a confundirse. En síntesis, el método escogido para identificar que un post destaca sobre los demás no es el más conveniente.



Más tarde les enviaré un mail con unas propuestas para mejorar el diseño de la identificación del post destacado. Sin embargo, un método sencillo y más efectivo, que mantiene la esencia de lo tienen actualmente, es colocarle un borde oscuro a las letras en lugar de ese sombreado. Dotará de más fuerza y cuerpo a las palabras.

Por XKlibur

PDA

10963 de clabLevel

25 tutoriales
60 articulos

  PDA Anime Bloggers Héroes Premio_Secretos

En algún lugar de mi casa de cuyo nombre no quiero acordarme

chrome
Citar            
MensajeEscrito el 07 Feb 2012 11:50 pm
hola,
seria interesante saber como llegaste a definir esas relaciones entre las variables para determinar que un post esta mejor posicionado que otro.

Por agares

Claber

105 de clabLevel

1 tutorial

Genero:Masculino  

Programmer, entrepreneur, gamer

chrome
Citar            
MensajeEscrito el 08 Feb 2012 08:00 pm

XKlibur escribió:

Con el nuevo enfoque, vemos en portada artículos, tutoriales y videotutoriales por igual. Dado que los artículos se publican en menor cantidad que los tutoriales y videotutoriales pienso que deberían tener más importancia que el resto del material publicado para permanecer mayor tiempo en portada.
Aunque existe una gran probabilidad de que un artículo se convierta en un post destacado, otros artículos pueden quedar sepultados por el constante material publicado. Esto afectaría principalmente a aquellos artículos en los que se anuncian concursos, votaciones, torneos, entre otras actividades propias de la comunidad.


La idea del nuevo diseño de la portada era esa, darle igual relevancia a los articulos, tutoriales y videotutoriales.

La meta de cristalab es difundir conocimientos. Por lo que: concursos, votaciones, torneos y otros como dices, muchas veces no entran allí. Claro, no dejan de ser importantes porque mantenemos y crecemos como comunidad.

Tenemos visitantes asiduos que no son parte de la comunidad, así que ellos vienen por el conocimiento, por eso que debemos darle importancia a los tutoriales y videotutoriales tanto como los articulos

Xklibur escribió:

Por otro lado, pienso que también podría considerarse como indicador la cantidad de veces que un usuario señala en facebook que un post le gusta o comparte dicho material. Si alguien comparte un post es porque lo considera realmente bueno en cualquier sentido. Muchas veces los usuarios no dejan comentarios aunque les guste un post, sino que lo comparten o señalan que les gusta en facebook.


Intereante esto...

Xklibur escribió:

Adicionalmente, tengo una inquietud respecto a la duración del post destacado: ¿En la duración no sería conveniente considerar el tipo de material publicado?, ¿cuántos días mínimos permanece un post como destacado? Hace poco rato cambió el post destacado y fue publicado el día 3 de febrero, ¿no les parece muy poco tiempo?. Si fuese un artículo a mí me parecería poco tiempo.


El calculo de posts destacado se hace cada hora (es una tarea programada), es decir, no es manual. Aunque a veces, yo lo ejecuto manual por pruebas.

Asi que, un post minimo duraria una hora como destacado, el tiempo máximo es depende: si es en portada 7 dias, si es en blog 60 días.


agares escribió:

seria interesante saber como llegaste a definir esas relaciones entre las variables para determinar que un post esta mejor posicionado que otro.


Una noche de análisis con ingente cantidad anfetaminas, café y LSD en mi organismo.

Pero no me alegro de ello, por lo que estoy cambiándolo.


Pd: es mentira, no consumo anfetaminas ni LSD

Por Maikel

BOFH

5575 de clabLevel

22 tutoriales
5 articulos

Genero:Masculino   Team Cristalab

Claber de baja indefinida

firefox
Citar            
MensajeEscrito el 08 Feb 2012 08:56 pm
Hey Maikel, ¿sería muy difícil que la portada para los integrantes de la comunidad tuviéramos un apartado de los post "de interés" de la comunidad? para los tipos de post que dice XK y para otros post (cómo los que estay siguiendo, los que he iniciado y los que he participado)

Por ElSiniestro

Claber

285 de clabLevel


1 articulo

Genero:Masculino  

Alguien que Ayuda

chrome
Citar            
MensajeEscrito el 11 Feb 2012 02:50 am
Hola Maikel

Estuve pensando bastante en la ecuación teniendo en cuenta lo que mencionaste y esta es mi opinión:

Código :

Valor = (V/T) + (C/V) + (P/100)


Por lo que veo en esta ecuación estas tratando de determinar 3 aspectos importantes:

  1. qué tan visitado es un tópico en un lapso de tiempo

    Código :

    (V/T)

  2. qué tanto debate tiene un tópico midiendo la cantidad de comentarios sobre la cantidad de visitas

    Código :

     (C/V)

  3. qué tan popular es el tópico teniendo en cuenta la cantidad de participantes únicos sobre 100(un valor que supongo usaste para atenuar).

    Código :

    (P/100)



El problema que veo entre estas tres variables es que no son proporcionales entre ellas y el hecho de sumarlas seguramente esta haciendo que uno de estos valores tome mayor relevancia.

Para ver la relación que hay entre cada aspectos supongamos el caso ideal donde cada uno tiene el mismo valor, digamos 1 en un lapso de una hora:

Para que V/T = 1 deberíamos tener 3600 visitas en una hora. una visita por cada segundo desde que se pública.
Para que C/V = 1 en el mismo conteo de visitas deberían haber al menos 3600 comentarios! esto si lo creo poco probable según el comportamiento normal de los foros. De igual manera si el post solo lo visitara una única persona y comentara, así lleve mucho tiempo esto ya lo haría muy relevante.
Por último deberían ser unos 100 participantes únicos durante el tiempo, esto ya de por si lo haría un post muy popular pero podría ser opacado por un post con el comportamiento anterior.

Lo que expongo es que evidentemente los aspectos no son comparables y el factor mas relevante al final termina siendo la cantidad de visitas en un lapso de tiempo.

La propuesta que te hago es que implementes algo similar a lo que se usa en las tiendas virtuales y permitas que los usuarios elijan si quieren ver el mas reciente, el mas visitado, el mas comentado o el mas popular. (un test A/B seria útil)

Por defecto puedes usar el que consideres mas relevante. pero un buen experimento seria utilizar diferentes combinaciones de los aspectos que tomas y observar como se comporta el liderboard de post. Esto lo puedes hacer sin que los clabers vean ningún cambio.

Saludos!

Por agares

Claber

105 de clabLevel

1 tutorial

Genero:Masculino  

Programmer, entrepreneur, gamer

firefox
Citar            
MensajeEscrito el 11 Feb 2012 05:13 pm
Sí, me di cuenta de los errores de la ecuación agares. Puesta en producción y con el SEO de cristalab un post reciente se catalogaba como destacado sobre los otros, sin siquiera tener comentarios ni participantes. Claro al paso del tiempo, se normalizaba pero está el error.

Esa formula quedó totalmente obsoleta, me fui por otro camino y que me gusto bastante el resultado. Cuando lo pueda generalizar para compartirlo les digo como funciona el nuevo algoritmo.

Por Maikel

BOFH

5575 de clabLevel

22 tutoriales
5 articulos

Genero:Masculino   Team Cristalab

Claber de baja indefinida

firefox
Citar            
MensajeEscrito el 11 Feb 2012 06:16 pm

Maikel escribió:

Sí, me di cuenta de los errores de la ecuación agares. Puesta en producción y con el SEO de cristalab un post reciente se catalogaba como destacado sobre los otros, sin siquiera tener comentarios ni participantes. Claro al paso del tiempo, se normalizaba pero está el error.

Esa formula quedó totalmente obsoleta, me fui por otro camino y que me gusto bastante el resultado. Cuando lo pueda generalizar para compartirlo les digo como funciona el nuevo algoritmo.


Grande Maikel :)

Por LeonidasEsteban

Claber

1127 de clabLevel

12 tutoriales
1 articulo

Genero:Masculino  

Front-End de #mejorandola

chrome
Citar            
MensajeEscrito el 11 Feb 2012 10:45 pm
Fue una de las razones por la que en mi propuesta no le di importancia a la fecha de creacion y en cambio me enfoque en la actividad. :p

Por Dano

BOFH

4273 de clabLevel

14 tutoriales
4 articulos
10 ejemplos

Genero:Masculino   Bastard Operators From Hell Premio_Secretos

Lugar estratégico para vigilarte

safari
Citar            
MensajeEscrito el 11 Feb 2012 11:46 pm
Yo aún mantengo las mismas variables Dano, como las trato es otra cosa.

Y ahora el resultado es un valor real entre 0 y 1. Siendo 1 un post perfecto, 0 para el peor post.

Voy a trabajar en generalizar el algoritmo y quizás me anime a hacer un plugin para wordpress para darle empuje al algoritmo, y por supuesto lo compartire en el github.

saludos

Por Maikel

BOFH

5575 de clabLevel

22 tutoriales
5 articulos

Genero:Masculino   Team Cristalab

Claber de baja indefinida

firefox
Ir a página 1, 2  Siguiente
Foros de discusión > Charla

 

Cristalab BabyBlue v4 + V4 © 2011 Cristalab
Powered by ClabEngines v4, HTML5, love and ponies.