fév 02 2008

Google, le “Web Social” via le Search et le Web Sémantique

Catégorie : GoogleSiM07 @ 18:19

Logo terre doréGoogle, tout comme Microsoft et Yahoo! on raté le coche du Web Social au profit de nouveaux acteurs comme MySpace, Facebook (mon profil) ou en France Skyrock Blog. Alors comment combler un gros retard rapidement ? en étant ouvert, c’est la solution de Google via son OpenSocial. Et aujourd’hui TechCrunch publie un article très intéressant sur ce projet très ambitieux du géant de Montain View via l’usage du web sémantique.

Vos amis via XFN

Si vous avez déjà utilisé Wordpress alors vous avez peut être remarquer que lorsque vous faites votre blogoliste vous spécifié si le lien que vous faites et vers un ami, un ami que vous avez déjà rencontré ou pas etc … Google analyse tous les liens visibles du web, c’est donc pour lui une mine d’information. Ces informations sur les liens font un XHTML Friends Network, plus connu sous le nom de XFN. Vous pouvez trouver plus d’information sur XFN sur le site officiel.

Vous via FOAF

Mais XFN ne donne aucune information sur vous à Google, pour les avoir, il y a FOAF. FOAF c’est un fichier RDF qui contient des informations sur vous, à l’image de votre vcard mais également des liens vers vos amis.

J’ai profité de cet article pour mettre à jour mes balises <link> en y glissant plus d’information lié au web sémantique. Vous pouvez accéder à mon fichier foaf dès maintenant. Je vais également refaire prochainement ma Blogoliste histoire de lui donner plus de sens et également compléter mon fichier foaf en utilisant plus de spécification.

L’avantage pour Google c’est que récupérer ce genre d’information c’est très facile lorsque l’on a sur ses disques pratiquement tout le web visible. Mais malheureusement il y a le web invisible, à ma connaissance aucun réseau social actuel n’utilise ce genre de spécification qui reste très obsolète. Google arrivera-t-il a faire un méta réseau social ?


déc 15 2007

La vengence de Microsoft sur moi est terrible !

Catégorie : MicrosoftSiM07 @ 22:56

Moi je ne crache jamais sur Microsoft (enfin …) en tout cas ils se vengent avec l’algorithme de Live Search !

Le résultat est … comment dire …

Recherche de SiM07 sur Live Search

On comprendra pourquoi Google est autant devant Live Search …


déc 02 2007

L’infrastructure serveur de Mininova, assez impressionante

Catégorie : Monde InternetSiM07 @ 15:52

Mininova, tout le monde connais aujourd’hui, c’est LE site de recherche de torrent. Mais savez-vous combien de serveurs se cache derrière ce site ? Quel type de serveur ? C’est moins impressionnant que chez Skyblog mais c’est tout aussi libre.

Pas d’apache mais du lighttpd avec php-fcgi, la base de donnée est confié à MySQL pour sa rapidité. Le système de cache est confié à XCache. La page d’accueil du site est ainsi rafraichie tous les 20 minutes. AMD et ses processeurs Opteron sont à l’honneur puisqu’il n’y a qu’un seul serveur Xeon Dual-Core pour le forum.

Graphiquement cela donne :

Illustration infrastructure serveur Mininova

 

www.mininova.org (180 Mbps)

1x loadbalancer
1x Opteron 165 1.8Ghz Dual Core 2MB Cache
2x 1GB DDR non-ECC CL2
2x 80GB SATA 8MB

5x frontend (lighttpd, php-fcgi, 1U server with 4GB)
1x Opteron 165 1.8Ghz Dual Core 2MB Cache
4x 1GB DDR non-ECC CL2
2x 80GB SATA 8MB

1x master database (mysql, only handles inserts/updates)
2x Opteron 265 1.8Ghz FSB Dual Core 2MB
8x 1GB 400Mhz DDR CL3 ECC Registered
8x 36GB SCSI 15KRPM

4x slave database (mysql, only handle selects)
1x Opteron 165 1.8Ghz Dual Core 2MB Cache
4x 1GB DDR non-ECC CL2 2x 80GB SATA 8MB

1x nfs (also serves as slave database cause it way to fast for nfs only)
1x Opteron 265 1.8Ghz FSB Dual Core 2MB
4x 2GB 400Mhz DDR CL3 ECC Registered
8x 36GB SCSI 15KRPM

2x search (sphinx)
1x Opteron 165 1.8Ghz Dual Core 2MB Cache
4x 1GB DDR non-ECC CL2 2x 80GB SATA 8MB

ads.mininova.org, snotr.com, blog.mininova.org, codepost.org (20 Mbps)

1x frontend (lighttpd, php-fcgi)
1x Opteron 165 1.8Ghz Dual Core 1MB Cache
2x 2GB DDR non-ECC CL2

3x php (php-fcgi)
1x Opteron 165 1.8Ghz Dual Core 1MB Cache
2x 2GB DDR non-ECC CL2
Croissance Mininova

1x database (mysql)
1x Opteron 165 1.8Ghz Dual Core 1MB Cache
2x 2GB DDR non-ECC CL2

forum.mininova.org (10 Mbps)

1x all round (at another data center, runs both lighttpd and mysql)
1x Xeon 3.0GHz Dual Core 2MB Cache
1x 1GB 400Mhz DDR ECC Registered
1x 160GB 7200RPM SATA

Cette infrastructure permet à Mininova de faire environ 3 millions de visiteurs par jour et 10 millions de téléchargements de torrent. La croissance est plutôt … pas mal !


juil 30 2007

links for 2007-07-29

Catégorie : Non classéSiM07 @ 1:23

juil 28 2007

Twitter c’est comme del.icio.us mais en moins bien

Catégorie : Non classéSiM07 @ 15:35

logo Del.icio.usDois-je présenter Twitter ? ce service de microblogging qui certains adorent et que d’autres déteste. Dois-je présenter Del.icio.us ? ce service de bookmarking collaboratif racheté par Yahoo! il y a de cela quelques temps. Vous pensez surement qu’il n’y a aucun rapport entre les deux n’est ce pas ? et pourtant détrompé vous ! Del.icio.us c’est si on l’utilise bien un super outil de microblogging !

Que permet Twitter ?

Lorsque l’on regarde de près l’usage de Twitter on est, à mon avis, soit dans le pire du web à la skyblog soit dans du partage, du partage de lien très souvent. Comme sur twitter l’auteur est limité en nombre de caractère on y trouve très souvent des liens vers des sites, des blogs etc … C’est un outil de communication parfait. C’est, toujours à mon avis, le meilleur de twitter, la découverte. Malheureusement on trouve également un très grand nombre d’informations totalement inutiles sur Twitter, on en à quoi a faire que LLM pense que l’iPhone bouffe de la batterie sans aucun argument ?

Del.icio.us à la rescousse !

Del.icio.us est un service beaucoup moins à la mode que Twitter et pourtant si on regarde de près il permet vraiment de suivre des choses très intéressante ! Comme Twitter il y a une API et de nombreuse application tourne autour, comme Twitter on peut ajouter des amis, comme Twitter on peut partager, comme Twiter on peut ajouter son petit commentaire sur un lien et mieux on peut même les classer. On utilise souvent pas le quart des possibilités de del.icio.us, en tout cas pour ma part, il est très rare que j’ajoute un commentaire sur un lien, très rare que je tag ce lien, et pourtant c’est un superbe outils, très complet.

Partager ses liens.

A partir d’aujourd’hui j’ai décidé de mieux utiliser delicious et de vous faire partager mes découvertes tous les jours via la fonction “daily blog posting”. Si tout ce passe bien, à 23h, les jours où j’aurais ajouté de nouveaux liens sur ce service, un article sera automatiquement posté. Un “en vrac” automatique si vous préférez :) Guim utilise déjà cette fonctionnalité, mon seul regret est de ne pas pouvoir publier plutôt un article par semaine. Je sais pas ce que vous en pensez mais je trouve cela beaucoup beaucoup mieux que ce genre de billet.

Alors voilà, exhorte tous ceux qui utilise des outils de Microblogging car c’est “in” à regarder vraiment l’usage qui font de ce genre de service et à regarder un peu autour. Twitter & co n’ont rien inventé, ils ont juste réussi à officialiser quelque chose de possible depuis déjà des mois si ce n’est des années ! Raconter n’importe quoi c’est con, partager c’est le plus souvent bien.

PS : Si il y a des utilisateurs de Twitter qui pouvaient m’expliquer vraiment les points positifs du microblogging je suis preneur, j’ai toujours beaucoup de mal à en comprendre l’intérêt.

Quelques liens :


juin 21 2007

Skyblog en v4, de plus en plus social network, de moins en moins blog.

Catégorie : Non classéSiM07 @ 14:19

Logo SkyblogL’équipe skyblog vient de sortir la v4 de skyblog pour tous et il y a du changement ! Outre les quelques améliorations du mois de mars avec le flux RSS et les permaliens c’est désormais un relookage complet qui est opéré sur l’ensemble de la kikoomunauté.

Je rassure tout le monde, les skyblogs roses sont toujours aussi moche ! mais sinon le rendu n’est pas trop trop mauvais sauf la pub en haut avec aucune intégration ! c’est comme sur technorati mais en moins pire, il faut dire qu’ils ont battu tous les records.

Plus réseau social

La plus grosse nouveauté c’est le panneau latéral droit avec sa liste d’ami et comme avant sa liste de skyblog, toujours aussi fermé (cf En quoi l’ouverture de skyblog n’est qu’un leurre ?). Le panneau latéral droit est désormais totalement consacré au skyblogueur. Il y a un gain en lisibilité qui n’est pas négligeable, c’était déjà un point fort des skyblogs, malheureusement les magnifiques dégradés doivent toujours être au programme :s, l’horreur HTML pas excellence !

On est loin de Wordpress ou de Dotclear quand même ! mais il y a du mieux.


juin 05 2007

En vrac

Catégorie : Non classéSiM07 @ 12:09

Cette semaine c’est semaine de partiels donc je n’ai pas trop le temps de blogguer, pas du tout même donc bon … Quelques trucs quand même.

Et voilà, je n’ai plus de temps, l’envie de manger des frites est plus fort !


mai 25 2007

L’infrastructure Skyblog, autant pour si peu !

Catégorie : Non classéSiM07 @ 19:29

Logo DebianSkyblog en chiffre c’est en avril 2007 plus de 8 000 000 de skyblogs (pour moi skyblog != blog), 380 000 000 d’articles et 840 000 000 de commentaires. Avec de tel chiffre il faut de bons serveurs derrières, et la devteam vient de publier les chiffres sur son blog (oui là j’accepte le terme).

Attention vous allez vous sentir tout petit ! L’article :

9 loadbalancers Zeus Layer 7 ZXTM: machines diverses;

50 frontaux Web Apache 1.3.x: bi dual-core, 6 Go de ram, PHP 5.2, Xcache, Nginx
pour les élements statiques;

50 serveurs MySQL 5.0.x: bi dual-core, 16 Go de ram, 8 disques SAS RAID 10 73 Go, en réplication
master/master;

30 serveurs Memcached 1.2.x: bi dual-core (complètement sous exploité actuellement :), 16 go de ram, 3 instances memcached de 4 Go par machine;

2 serveur de sessions sharedance: stockage tmpfs 6 go (on en utilise grosso modo la moitié), un en master, un en secours;

1 cluster de stockage Isilon: 40 nodes de 12 disques SATA pour le stockage; A coté, divers types de stockages encore un peu utilisés (principalement des restes d’avant Isilon), avec SAN Sata Transtec, SAN Fiber Chanel Transtec, SAN Fiber Chanel Storagtek, SCSI Interne, SATA Interne… Oui, on a essayé beaucoup de systèmes différents par le passé :-)

Le tout tourne sous Linux x86_64, généralement du debian avec nos paquets.

Dans le lot, ya quelques machines de secours, quelques machines qui maintenant servent à autre chose, etc, mais grosso modo, le compte y est. Il faut aussi rajouter diverses machines pour les taches planifiées, la supervision (munin, nagios, outil de gestion des bascules master actif / master passif…). Avec tout ca on sert 4Gbps d’images, textes, musique (hors radio), pub, etc.

Bon voilà ! Autant de serveurs pour si peu de contenu de qualité ! c’est malheureux, parfois j’ai envie d’être écolo …


mai 05 2007

Révéler sa réel identité sur Internet, trop facile ?

Catégorie : Non classéSiM07 @ 17:05

Il m’aura suffit de 24 heures pour qu’en cherchant mon prénom et mon nom sur Google, il donne comme premier résultat mon blog ! Alors même si il y a quelques temps j’écrivais un article intitulé “Pourquoi je reste derrière mon pseudo”, j’ai un peu changé d’avis. Il faut dire mon blog commence à avoir une audience certaine et il est parfois pratique de le révéler en l’utilisant avec parcimonie.

Le résultat :

Recherche de mon nom et prénom sur Google

Dans les fait cette rapidité est super inquiétante et révèle un gros problème car dans mon blog je n’ai JAMAIS donné mon nom et mon prénom ! Pourtant Google donne bien mon blog comme premier résultat. Conclusion il suffit qu’une personne mal intentionné fasse un lien de qualité pour que Google donne lerésultat derrière le lien. Il y a un gros problème de contrôle de son identité, imaginez les skybloggeurs … un seul lien et il suffit de les googler pour apprendre plein de chose sur eux.

Sinon maintenant que j’ai révélé mon nom et prénom sur Infos-du-net j’ai complété mon profil Ziki.com ;)


avr 09 2007

En quoi l’ouverture de skyblog n’est qu’un leurre ?

Catégorie : Non classéSiM07 @ 14:54

logo devteam skyblogDans un billet précédant je vous informais de l’ouverture depuis l’extérieur de la plate-forme de blog skyblog, cette ouverture via le fil RSS et l’internationalisation de la plate-forme va la faire entrer sur technorati qui référence tout les blogs à travers le monde. En réfléchissant un peu et en regardant de plus près (pas trop j’ai aussi posé des questions, merci d’ailleurs) je me suis vite rendu compte qu’il ne fallait pas se fier au apparence et qu’il restait encore beaucoup de travail et de temps avant de pouvoir qualifier skyblog de blog.

Mon argumentaire repose sur un point, la politique de gestion des liens par Skyrock. Simple question : Vous avez des amis qui utilise autre chose que skyblog ? Oui ? pourquoi n’est-il pas dans votre liste d’amis ? c’est tout simplement impossible ! Vos amis sont obligé d’avoir un skyblog pour y être, vous avez dit ouverture ?

Regardons de plus près l’utilisation de l’attribut pour la balise A de rel=”nofollow”, toutes la listes d’amis ne possède pas cet argument, normal il n’y a que des skyblogs, en bas dans le footer les liens vers les sites du skyrock network c’est la même chose. Sinon dans le contenu, le seul endroit ou le skybloggueur a du pouvoir tous les liens son systématiquement avec l’attribut rel=”nofollow” histoire que Google n’index rien en dehors du réseau skyrock. On notera une absurdité du plus haut point, un skyblog ajouté dans le contenu est également avec l’attribut rel=”nofollow” ! pourtant c’est une bonne occasion d’avoir un lien avec un titre différent, titre dont Google attache une certaine importance (cf Google Webmaster).

Ouvert de l’extérieur, Fermé de l’intérieur

logo FirewallL’objectif de Skyblog est clair : entrez sur notre plate-forme, regardez comme on communique vers l’extérieur ! mais si on regarde de l’intérieur les portes sont désespérément closes et il impossible de mettre skyblog dans une blogosphère ou tout le monde communique avec tout le monde indépendamment de la plate-forme, indépendamment de l’hébergeur mais en faisant confiance en son contenu.

Ouvert, fermé ? à vous de juger les deux sans doute, Skyblog c’est un firewall monodirectionnel filtrant que le traffic sortant à mon avis.


Page suivante »