É-Veille Tech #34 | 16/04/23 | Apprentissage Continu

É-Veille Tech #34 | 16/04/23 | Apprentissage Continu

17 avril 2023 0 Par Aschen

Pour suivre la veille technologique chaque jour au fil de l’eau, rendez vous sur 👉 https://links.aschen.tech

PROGRAMMATION

Phind: AI search engine

Un moteur de connaissance backé par un LLM (surement OpenAI) mais qui en plus cite les sources.

Très utile pour débrouissailler des sujets de dev lorsqu’on est en phase de recherche / prototypage et qu’on a besoin de comprendre des technos

Ci-JIT PHP 8

Explications très détaillées sur le compilateur Just In Time (JIT) introduit dans PHP 8.

Concrètement ça améliore la vitesse d’exécution de votre code au fur et à mesure que celui-ci est executé en compilant spécifiquement en code machine (assembleur) certaines function qui sont appellés toujours avec les mêmes types.

C’est le même principe que le JIT dans la JVM ou v8.

je ne suis pas sûr que vous obteniez des améliorations aussi bonnes mais ça ouvre la porte à d’autres types d’applications boudés par souci de performances, comme l’IA, le jeu vidéo, les statistiques..

Par contre ça m’étonnerait qu’on se mette à faire de l’IA, du jeu vidéo ou n’importe quoi d’autre qui demande des performances avec PHP car le JIT reste quand même bien moins optimisé qu’une compilation Ahead Of Time (C++, Rust, Golang, etc)

Les objets callisthéniques, ou comment coder des trucs plus légers qui durent plus longtemps. | by Dimitri Lahaye | Mar, 2023 | Medium

Une pratique qui ressemble à SOLID mais avec des règles un peu dogmatiques et assez strictes:

  • One level of indentation per method
  • Don’t use the ELSE keyword
  • Wrap all primitives and Strings
  • First class collections
  • One dot per line
  • Don’t abbreviate
  • Keep all entities small
  • No classes with more than two instance variables
  • No getters/setters/properties

C’est intéressant de remettre en question son code par rapport à ces règles mais attention à ne pas tomber dans un dogme aveugle non plus.

Rust tutoriel FR

Tutoriel très complet pour Rust et complètement en français

ARCHITECTURE

Pinecone, what is a Vector Database for AI?

Un nouveau type de base de données qui émerge avec l’IA: la base de données vectorielle

En IA, on représente les données du monde réel sous la forme de vecteurs à N dimensions. Concrètement ce sont des tableaux de nombres à virgules.

Ce genre de base de donnée permet ensuite de rechercher plus efficacement des vecteurs qui sont proches par exemple.

Un exemple de recherche de contexte similaire lors d’une question posée à GPT3 https://docs.pinecone.io/docs/gen-qa-openai

Email authentication from Zero to BIMI

Il est possible d’ajouter un logo officiel dans sa zone DNS pour que les fournisseurs d’emails puissent l’afficher.

Cela s’appelle BIMI (Brand Indicators for Message Identification) et c’est une spécification poussée par les plus gros fournisseurs d’emails de la planête (Google, Yahoo, Sendgrid, Mailchimp, etc)

Chez Malt ça a permi d’améliorer le taux d’ouverture en passant de 40% à 60% !

AI

Auto-GPT, An experimental open-source attempt to make GPT-4 fully autonomous.

Auto-GPT utilise un LLM et est capable de:

  • récupérer des informations sur internet
  • conserver des informations en mémoire
  • générer sa propre liste de tâche pour répondre à une question

Ça permet d’avoir des agents capable d’améliorer leurs réponses et de réfléchir à des tâches plus complexes.

Pleins d’exemples ici https://twitter.com/NathanLands/status/1646101184384573446?s=20

A Watermark for Large Language Models

Une méthode pour ajouter un watermark sur le texte généré par un LLM.

Ça permet de s’assurer qu’un modèle n’est pas utilisé de manière frauduleuse par exemple.

C’est utilisé par HuggingFace par exemple https://github.com/huggingface/text-generation-inference

Compress LLM input

Un exemple pour compresser un input pour un LLM en utilisant un LLM.

Ici une simple phrase exprime un paragraphe entier:

RcS:skptic&rspctfl_cnstrctvCritic;IdeaPrpsl:frmbHnstCrtcsm

La couleur des mots

Explication très clair du fonctionnement des modèles Transformer de type GPT.

SECURITE

DDoS threat report for 2023 Q1

Le rapport trimestriel de Cloudflare sur les attaques DDOS.

Ils notent une recrudescence des botnet VPS vs botnet IoT, ce qui permet des attaques encore plus massive (ils « detiennent » le record de l’attaque subie avec 71 millions req/s)

Le nombre de Ransom DDOS augmente également (demande de rançon sinon les infrastructures sont DDOS)

iOne place for all the default credentials to assist the Blue/Red teamers activities on finding devices with default password 🛡️

Base de données des mots de passe par défaut des constructeurs de hardware

OUTILS

Chrome’s Headless mode gets an upgrade: introducing `–headless=new`

Une amélioration du mode headless dans Chrome.

Avant cette mise à jour (112), le mode headless était enfaite un autre programme et avait donc un fonctionnement légèrement différent de chrome.

FlutterFlow, turn your ideas into products

Un éditeur no-code pour créer des applications Flutter.

C’est un mix entre un éditeur no-code et Figma avec un export possible du code source (Dart + Flutter).

Ça supporte un déploiement mobile (APK) mais aussi web!

Ça sera certainement pas à la hauteur d’un code écrit spécifiquement pour design l’interface mais honnêtement le fait que ce soit en Flutter me rassure car la complexité d’un layout Flutter est bien moindre qu’un layout fait en CSS/HTML donc je ne pense pas qu’on ait le même genre de bouse abjecte type Windev.

PRIVACY

L’histoire du logiciel : entre collaboration et confiscation des libertés

La grande épopée de l’informatique et du logiciel libre racontée par Ploum.

Twitter’s Open Source Algorithm – Unveiling the code, but not the secrets

Le fait d’avoir open sourcé le code de l’algorithme de Twitter ne permet pas de répondre à toutes les questions comme « Quelles sont les personnalités mises en avant ? »

Par exemple un algorithme possédant 48 millions de paramètres est constamment mis à jour par Twitter pour pondérer l’affichage des tweets.

Typiquement l’analogie Tech serait de dire que twitter publie ses sources mais sans les données on est bien incapable de comprendre le fonctionnement actuel de l’algorithme.

Après le green-washing, le libre-washing ? (cc Sebsauvage)

AUTRES

Science Labs | Boutique Objets & Décorations Science

Un site français pour acheter des objets scientifique

Tetris game implemented in pure bash.

Un Tetris directement dans votre terminal 😀

bash <(curl https://raw.githubusercontent.com/dkorolev/bash-tetris/master/tetris.sh)

Des salariés licenciés par les Big Tech ironisent sur le fait d’avoir été payés à ne rien faire

A peine croyable mais pourtant vrai

Half-Life: Alyx fully playable without VR even on Steam Deck thanks to a mod

Half-Life Alyx est maintenant disponible sans la VR grâce au travail de la communauté.

C’est quand même toujours impressionnant de voir à quel point les fans peuvent investir du temps pour améliorer/créer des jeux vidéos.

Le meilleur exemple dans l’univers HL reste Black Mesa Source qui est une réécriture complète de Half-Life 1 en utilisant le moteur de Half-Life 2.

Understanding SSD Technology: NVMe, SATA, M.2

Un article qui explique les différences entre NVMe et SATA pour la connectique des disques dur.

La rapidité de NVMe s’explique entre autre par un accès direct du driver au CPU quand le driver AHCI (SATA) communique avec le SATA controller.

SOCIETE

Un pays mûr pour le fascisme

Qu’une élite dirigeante ferme toute fenêtre démocratique en dehors du cadre électoral, et exige de nous allégeance et silence pendant l’exercice du mandat, voilà qui devrait être de nature à nous inquiéter.

Il faut appeler un chat, un État policier ! | Reflets.info