
É-Veille Tech #34 | 16/04/23 | Apprentissage Continu
Pour suivre la veille technologique chaque jour au fil de l’eau, rendez vous sur 👉 https://links.aschen.tech
PROGRAMMATION
Phind: AI search engine
Un moteur de connaissance backé par un LLM (surement OpenAI) mais qui en plus cite les sources.
Très utile pour débrouissailler des sujets de dev lorsqu’on est en phase de recherche / prototypage et qu’on a besoin de comprendre des technos
Ci-JIT PHP 8
Explications très détaillées sur le compilateur Just In Time (JIT) introduit dans PHP 8.
Concrètement ça améliore la vitesse d’exécution de votre code au fur et à mesure que celui-ci est executé en compilant spécifiquement en code machine (assembleur) certaines function qui sont appellés toujours avec les mêmes types.
C’est le même principe que le JIT dans la JVM ou v8.
je ne suis pas sûr que vous obteniez des améliorations aussi bonnes mais ça ouvre la porte à d’autres types d’applications boudés par souci de performances, comme l’IA, le jeu vidéo, les statistiques..
Par contre ça m’étonnerait qu’on se mette à faire de l’IA, du jeu vidéo ou n’importe quoi d’autre qui demande des performances avec PHP car le JIT reste quand même bien moins optimisé qu’une compilation Ahead Of Time (C++, Rust, Golang, etc)
Les objets callisthéniques, ou comment coder des trucs plus légers qui durent plus longtemps. | by Dimitri Lahaye | Mar, 2023 | Medium
Une pratique qui ressemble à SOLID mais avec des règles un peu dogmatiques et assez strictes:
- One level of indentation per method
- Don’t use the ELSE keyword
- Wrap all primitives and Strings
- First class collections
- One dot per line
- Don’t abbreviate
- Keep all entities small
- No classes with more than two instance variables
- No getters/setters/properties
C’est intéressant de remettre en question son code par rapport à ces règles mais attention à ne pas tomber dans un dogme aveugle non plus.
Rust tutoriel FR
Tutoriel très complet pour Rust et complètement en français
ARCHITECTURE
Pinecone, what is a Vector Database for AI?
Un nouveau type de base de données qui émerge avec l’IA: la base de données vectorielle
En IA, on représente les données du monde réel sous la forme de vecteurs à N dimensions. Concrètement ce sont des tableaux de nombres à virgules.
Ce genre de base de donnée permet ensuite de rechercher plus efficacement des vecteurs qui sont proches par exemple.
Un exemple de recherche de contexte similaire lors d’une question posée à GPT3 https://docs.pinecone.io/docs/gen-qa-openai
Email authentication from Zero to BIMI
Il est possible d’ajouter un logo officiel dans sa zone DNS pour que les fournisseurs d’emails puissent l’afficher.
Cela s’appelle BIMI (Brand Indicators for Message Identification) et c’est une spécification poussée par les plus gros fournisseurs d’emails de la planête (Google, Yahoo, Sendgrid, Mailchimp, etc)
Chez Malt ça a permi d’améliorer le taux d’ouverture en passant de 40% à 60% !
AI
Auto-GPT, An experimental open-source attempt to make GPT-4 fully autonomous.
Auto-GPT utilise un LLM et est capable de:
- récupérer des informations sur internet
- conserver des informations en mémoire
- générer sa propre liste de tâche pour répondre à une question
Ça permet d’avoir des agents capable d’améliorer leurs réponses et de réfléchir à des tâches plus complexes.
Pleins d’exemples ici https://twitter.com/NathanLands/status/1646101184384573446?s=20
A Watermark for Large Language Models
Une méthode pour ajouter un watermark sur le texte généré par un LLM.
Ça permet de s’assurer qu’un modèle n’est pas utilisé de manière frauduleuse par exemple.
C’est utilisé par HuggingFace par exemple https://github.com/huggingface/text-generation-inference
Compress LLM input
Un exemple pour compresser un input pour un LLM en utilisant un LLM.
Ici une simple phrase exprime un paragraphe entier:
RcS:skptic&rspctfl_cnstrctvCritic;IdeaPrpsl:frmbHnstCrtcsm
La couleur des mots
Explication très clair du fonctionnement des modèles Transformer de type GPT.
SECURITE
DDoS threat report for 2023 Q1
Le rapport trimestriel de Cloudflare sur les attaques DDOS.
Ils notent une recrudescence des botnet VPS vs botnet IoT, ce qui permet des attaques encore plus massive (ils « detiennent » le record de l’attaque subie avec 71 millions req/s)
Le nombre de Ransom DDOS augmente également (demande de rançon sinon les infrastructures sont DDOS)
iOne place for all the default credentials to assist the Blue/Red teamers activities on finding devices with default password 🛡️
Base de données des mots de passe par défaut des constructeurs de hardware
OUTILS
Chrome’s Headless mode gets an upgrade: introducing `–headless=new`
Une amélioration du mode headless dans Chrome.
Avant cette mise à jour (112), le mode headless était enfaite un autre programme et avait donc un fonctionnement légèrement différent de chrome.
FlutterFlow, turn your ideas into products
Un éditeur no-code pour créer des applications Flutter.
C’est un mix entre un éditeur no-code et Figma avec un export possible du code source (Dart + Flutter).
Ça supporte un déploiement mobile (APK) mais aussi web!
Ça sera certainement pas à la hauteur d’un code écrit spécifiquement pour design l’interface mais honnêtement le fait que ce soit en Flutter me rassure car la complexité d’un layout Flutter est bien moindre qu’un layout fait en CSS/HTML donc je ne pense pas qu’on ait le même genre de bouse abjecte type Windev.
PRIVACY
L’histoire du logiciel : entre collaboration et confiscation des libertés
La grande épopée de l’informatique et du logiciel libre racontée par Ploum.
Twitter’s Open Source Algorithm – Unveiling the code, but not the secrets
Le fait d’avoir open sourcé le code de l’algorithme de Twitter ne permet pas de répondre à toutes les questions comme « Quelles sont les personnalités mises en avant ? »
Par exemple un algorithme possédant 48 millions de paramètres est constamment mis à jour par Twitter pour pondérer l’affichage des tweets.
Typiquement l’analogie Tech serait de dire que twitter publie ses sources mais sans les données on est bien incapable de comprendre le fonctionnement actuel de l’algorithme.
Après le green-washing, le libre-washing ? (cc Sebsauvage)
AUTRES
Science Labs | Boutique Objets & Décorations Science
Un site français pour acheter des objets scientifique
Tetris game implemented in pure bash.
Un Tetris directement dans votre terminal 😀
bash <(curl https://raw.githubusercontent.com/dkorolev/bash-tetris/master/tetris.sh)
Des salariés licenciés par les Big Tech ironisent sur le fait d’avoir été payés à ne rien faire
A peine croyable mais pourtant vrai
Half-Life: Alyx fully playable without VR even on Steam Deck thanks to a mod
Half-Life Alyx est maintenant disponible sans la VR grâce au travail de la communauté.
C’est quand même toujours impressionnant de voir à quel point les fans peuvent investir du temps pour améliorer/créer des jeux vidéos.
Le meilleur exemple dans l’univers HL reste Black Mesa Source qui est une réécriture complète de Half-Life 1 en utilisant le moteur de Half-Life 2.
Understanding SSD Technology: NVMe, SATA, M.2
Un article qui explique les différences entre NVMe et SATA pour la connectique des disques dur.
La rapidité de NVMe s’explique entre autre par un accès direct du driver au CPU quand le driver AHCI (SATA) communique avec le SATA controller.
SOCIETE
Un pays mûr pour le fascisme
Qu’une élite dirigeante ferme toute fenêtre démocratique en dehors du cadre électoral, et exige de nous allégeance et silence pendant l’exercice du mandat, voilà qui devrait être de nature à nous inquiéter.