Hoy me ha llegado un mensaje de la Comunidad de Madrid en relación a mi beca. En el campo To del mensaje se incluían 363 direcciones de correo electrónico. No sé si serán todos los becarios, pero sí que es una buena muestra para jugar un rato.
Lo primero que he hecho es parsear el e-mail, y obtener las direcciones de e-mail de cada destinatario. Luego he tomado las dos últimas partes del dominio (nombre de dominio, más dominio de primer nivel). Por ejemplo urjc.es, y he sacado una estadística para ver la frecuencia de cada dominio.
El resultado para el dominio de primer nivel se muestra en la siguiente gráfica:

Los números son los siguientes:
| Dominio | % |
| it | 0.275482093664 |
| org | 0.550964187328 |
| net | 15.7024793388 |
| com | 16.5289256198 |
| fm | 0.275482093664 |
| es | 66.6666666667 |
En cuanto a los nombres de dominio, los resultados se muestran en la siguiente gráfica:

Hay también una gráfica con todos los nombres de dominio.
Por este orden, los nombres de dominio más frecuentes son: uam (18.18%), madrimasd (14.05%), hotmail (11.29%), csic (11.02%), yahoo (9.92%), ucm (7.44%), upm (4.96%), uc3m (3.58%), uah (2.75%), cnio (2.20%), telefonica (1.65%), gmail (1.38%) y urjc (1.10%). El resto están todos por debajo del 1%.
Los números completos son éstos:
| Nombre | % |
| uned | 0.275482093664 |
| rae | 0.275482093664 |
| ole | 0.275482093664 |
| ciemat | 0.275482093664 |
| madrid | 0.550964187328 |
| isciii | 0.550964187328 |
| uah | 2.75482093664 |
| latinmail | 0.275482093664 |
| uam | 18.1818181818 |
| ucm | 7.43801652893 |
| ieee | 0.275482093664 |
| gmail | 1.37741046832 |
| upco | 0.275482093664 |
| msn | 0.550964187328 |
| ceu | 0.826446280992 |
| inicia | 0.550964187328 |
| urjc | 1.10192837466 |
| hotmail | 11.2947658402 |
| march | 0.550964187328 |
| teleline | 0.275482093664 |
| fastmail | 0.275482093664 |
| yahoo | 9.9173553719 |
| terra | 0.826446280992 |
| csic | 11.0192837466 |
| madrimasd | 14.0495867769 |
| lycos | 0.550964187328 |
| wanadoo | 0.826446280992 |
| cnio | 2.20385674931 |
| mixmail | 0.275482093664 |
| retecal | 0.275482093664 |
| upm | 4.95867768595 |
| robozoes | 0.275482093664 |
| fjd | 0.275482093664 |
| cnic | 0.275482093664 |
| telefonica | 1.65289256198 |
| jazzfree | 0.275482093664 |
| hayoo | 0.275482093664 |
| uc3m | 3.58126721763 |
| cisc | 0.275482093664 |

Está claro que a Isra le pirran las estadísticas. Bueno, a la vista de los resultados, los de la urjc tienen pocas posibilidades…
… y si consigues una de madri+d.org tus posibilidades aumentan.
Moraleja: consigue un alias allí y luego presenta una solicitud.
Estadística, pura estadística.
Ésa es una posibilidad
. La otra es que la Universidad Autónoma de Madrid es la que tiene más becarios, seguida de la Complutense, la Politécnica, la Carlos III, la de Alcalá de Henares, y nuestra querida Rey Juan Carlos. De todas formas, estaría bien normalizar estos resultados teniendo en cuenta el número de alumnos de cada universidad.
También están de por medio los centros de investigación (sobre todo CSIC, parece que hay pocos con e-mail en el CIEMAT), y las privadas (que tienen muy pocos becarios FPI).
Hola, por curiosidad que herramientas has usado
scripts en perl o algo asi.
tx
Santi.
Un script en Python.
Te lo puedes descargar en http://gsyc.escet.urjc.es/~herraiz/fpi.py
thanx
Santi.
PD: Sabes si tienes problemas con bloglines ?, he hecho la sindicacion con atom
pero no me ha cogido los feeds. Me daba 7 como pedientes de leer pero al ir a
leerlos han desaparecido.
Perdona, parece que ahora va bien.
Santi.
Ok. Pero creo que no tengo sindicación Atom, sólo RSS.
El enlace es http://blog.herraiz.org/feed/
Un saludo.