Fini le carnage

Enfin bientôt, j’espère !

Quand je parle de carnage, je parle de ça. Et encore ce sont les meilleures. Donc fini le carnage car je vais bientôt être détenteur d’un magnifique Canon EOS 500D. Je sais, le 550D est sorti le premier Mars, mais considérant le facteur du prix et celui de mon niveau, le 500D est déjà amplement suffisant.

pyAggr3g470r – Démonstration

Bien que pyAggr3g470r a été développé pour une utilisation personnelle j’ai décidé de prendre le risque de lhéberger temporairement sur mon vieux serveur. Je pense qu’il commence à être assez fonctionnel, mais peut être pas forcément pour être disponible sur Internet 😉 Voilà ce n’est qu’une démonstration.

Détection de langues avec Python

Ce billet a simplement pour but de présenter le module Python oice.langdet sous licence GPL v3. Ce module permet de détecter la langue d’un texte (Anglais, Espagnol et Français). Comme vous pouvez le voir en suivant le lien précédent il est vraiment simple d’utilisation et les résultats sontassez bons. Je me suis dit que je pouvais tester ce module avec pyAggr3g470r sur la description des articles. Et en effet les résultats sont plutôt satisfaisants. Sur 684 articles le module trouve 332 articles en anglais et 166 en français avec peu derreurs. Il faut préciser que pour diverses raisons (notamment de performances) je passe à l’algorithme uniquement les 80 premiers caractères. De plus certains articles nont pas de descriptions ou alors des descriptions exotiques du type mot clés…

Python 3

Minesweeper 3K

Cela fait maintenant quelques temps que j’ai lintention de porter certains de mes projets vers Python 3. Ainsi cette après-midi j’ai un peu joué avec 2to3. En fait une petite demi-heure. J’ai d’abord essayé de l’utiliser avec les sources de pyAggr3g470r. À ma grande surprise ça a fonctionné. Le seul hic est que CherryPy n’est pas encore tout à fait prêt pour Python 3. Je suis entrain de le porter moi-même, à “la main”. Je vous dirai si jy arrive… En fait j’aimerai bien que pyAggr3g470r tourne sous Python 2.7 (pas encore sortie) ou Python 3.1 afin de pouvoir usiter les dictionnaires ordonnés… Dernière information hors-sujet: maintenant TuxDroid peut vous prévenir lorsque des articles sont non lus 😉

pyAggr3g470r 0.8 – Changelog

Et voilà la version 0.8 de pyAggr3g470r. Principales modifications:

  • la base est plus petite (moins de redondances). Bien qu’elle était déjà assez petite (environ 3Mo pour plus de 1200 articles, maintenant bien moins);
  • la recherche fonctionne mieux (les balises HTML sont filtrées avec une expression régulière…);
  • il est possible de partager un article sur delicious, reddit, Digg, Scoopeo et Blogmarks très simplement;
  • la page de gestion présente des informations sur la base ainsi que des statistiques sur les mots (avec un histogramme en utilisant matplotlib). Cette page permettra aussi d’ajouter des flux avec une adresse d’un site.

On ma proposé aujourd’hui d’afficher les images des flux (comme des favicons) en me disant qu’elles sont disponibles dans les flux. J’ai vérifié et en effet il est possible de trouver ces images (ou leur adresses). Seulement je me rends compte que peu de flux utilisent cette fonctionnalité. Du coup je pense que des agrégateurs comme aKregator utilisent plutôt les favicons.

Google Bu(g|zz)

Voyant la déferlante de plaintes contre le nouveau service Google Buzz je me pose quelques questions. En effet je ne vois pas trop la différence avec identi.ca du point de vue liberté (pas technologique). Que ce soit avec Buzz ou identi.ca par défaut tout est public, il est possible de s’abonner aux mises à jour d’autres utilisateurs, de voir les contacts des contacts. On peut aussi avec les deux services poster en privé. Et il y a la géolocalisation. Le seul tord que je fait à Google c’est qu’au début Buzz était activé par défaut dans Gmail. Alors qu’à la base mon compte Gmail m’est utile pour les mails et n’est pas un service de réseau social… Et puis franchement après Facebook, peut on faire pire?

pyAggr3g470r 0.6 – Changelog

Et voilà la version 0.6 de pyAggr3g470r. Principales modifications:

  • les articles non lus sont affichés en gras (et ajout dans la base d’un champ pour distinguer les articles lus de ceux qui ne le sont pas);
  • le menu de droite indique maintenant pour chaque flux le nombre d’articles total ainsi que le nombre d’articles non lus;
  • pour chaque flux, la page principale présente les 10 derniers articles;
  • évidemment pour chaque flux on peut voir la liste de tout les articles (en cliquant sur “All articles”);
  • cliquer sur le nombre d’articles non lus dans le menu de droite (ou à gauche quand il y a des articles non lus) permet de voir uniquement les articles non lus;
  • cliquer sur un article ouvre sa description dans un nouvel onglet, avec à la fin de la description un lien vers l’article original. L’ouverture dans un nouvel onglet est accompagnée de lattribut rel=”noreferrer”. Avec cet attribut Chrome est forcé de créer un nouveau processus. Ce qui devrait être automatique quand on consulte l’article original étant donné que le domaine n’est plus le même. Cette fonctionalité devrait arriver dans un certain temps sur Firefox;
  • correction de deux bugs stupides.

Je pense que maintenant on peut agréablement l’utiliser avec pas mal de flux. En tout cas avec une trentaine de flux c’est encore utilisable. Et la base SQLite ne devient pas trop grosse (environ 2 Mo pour 500 articles dans 23 flux).  aKregator utilise quand même plus de un giga octet de sauvegarde sur mon disque. Ce sera encore mieux avec la recherche sur le contenu des descriptions 😉

pyAggr3g470r 0.4

Il arrive que les trajets de train soient assez productifs (parfois…). (Ah si j’avais un de ces petits Eee PC avec une autonomie de 12 heures…) Bref, ce dernier trajet me donne l’occasion d’annoncer la version 0.4 de pyAggr3g470r. Déjà !

pyAggr3g470r

Really first version of pyAggr3g470r

Aujourd’hui j’ai l’honneur de vous présenter: pyAggr3g470r ! Le futur fabuleux agrégateur d’informations 🙂

Gandi

Le changement d’adresse va-til avoir lieu plus tôt que “prévu” (prévu est un grand mot) ? Je viens de recevoir un courrier de “Domain Renewal Group” minvitant à renouveler mon nom de domaine inutilisé. Cela pour 28 €/an (c’est un .org). Ayant dépassé (surprise) la date de réponse, j’ai voulu renouveler mon nom de domaine directement sur gandi.net. Et la c’est 12 €/an. Heureusement que j’ai traîné… La deuxième chose que j’ai découverte c’est que j’ai un blog (dotclear) qui est maintenant compris avec le pack de base, on va dire gratuit.