Le podcast Java en Français

Les Cast Codeurs est un podcast en français de, par et pour les développeurs.

Prenez connaissance des dernières nouvelles de la sphère Java et du développement en général. Plongez sur un sujet précis avec les épisodes interview.

Supportez les radotages de vos hôtes : Emmanuel Bernard (JBoss, Hibernate), Arnaud Héritier (Doctolib, Jenkins), Guillaume Laforge (Google, Groovy), Antonio Goncalves (Microsoft, auteur), Vincent Massol (XWiki, Maven), Audrey Neveu (Reactor/Spring, Devoxx4Kids). Katia Aresti (Red Hat, Infinispan).

LCC 301 - Minoritaire ou majoritaire, là est la question!

Posté le 23/10/2023

Dans cet épisode, Emmanuel et Guillaume reviennent sur les nouveautés de l’écosystème Java (Java 21, SDKman, Temurin, JBang, Quarkus, LangChain4J…) mais aussi sur des sujets plus généraux comme Unicode, WebAssembly, les bases de données vectorielles, et bien d’autres sujets orientés IA (LLM, ChatGPT, Anthropic…).

Enregistré le 20 octobre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-301.mp3

News

Langages

Gérer facilement de multiples versions de Java grâce à SDKMan! https://foojay.io/today/easily-manage-different-java-versions-on-your-machine-with-sdkman/

  • SDKMan! supporte Java, mais aussi GraalVM, JBang, Quarkus, Micronaut… (les CLIs).
  • La CLI UI est toujours un peu chelou, donc cet article est utile pour un rappel.

Tous les changements de Java 8 à Java 21 https://advancedweb.hu/a-categorized-list-of-all-java-and-jvm-features-since-jdk-8-to-21/

  • Nous avons déjà partagé ce lien par le passé, mais l’article est mis à jour à chaque release majeure de Java pour couvrir les dernières nouveautés. Et en particulier, Java 21 qui vient de sortir.

Eclipse Temurin ne va pas sortir son Java 21 tout de suite https://adoptium.net/en-GB/blog/2023/09/temurin21-delay/

  • Apparemment, une nouvelle licence pour le TCK (qui valide la compliance) doit être approuvée.
  • Oracle semble avoir sorti de nouveaux termes, à quelques jours de la sortie officielle de Java 21.
  • La mise à jour du TCK est arrivée le 9 octobre.
  • Comment Microsoft a pu sortir le sien avant ?

Le Financial Times propose un bel article avec des animations graphiques expliquant le fonctionnement de l’architecture de réseau de neurones de type transformers, utilisé dans les Large Language Models https://ig.ft.com/generative-ai/

  • LLM via relation entre les mots.
  • Notion de transformer, qui parse les “phrases” entières ce qui capture le contexte.
  • Discute le beam search vs greedy search pour avoir non pas le prochain mot, mais l’ensemble des prochains mots.
  • L’article parle de texte/vector embeddings pour représenter les tokens et leurs relations aux autres.
  • Il décrit le processus d’attention qui permet aux LLM de comprendre les associations fréquentes entre tokens
  • Le sujet des hallucinations est couvert.
  • Et pour éviter des hallucinations, utilisation du grounding.

The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 https://tonsky.me/blog/unicode/

  • Un bel article qui explique Unicode, les encodings comme UTF-8 ou UTF-16, les code points, les graphèmes, les problèmes pour mesurer une chaîne de caractères, les normalisations de graphèmes pour la comparaison de chaîne.
  • Si vous voulez mieux comprendre Unicode, c’est l’article à lire !
  • Unicode, c’est un mapping chiffre - caractère en gros.
  • 1,1 million de caractères disponibles, dont 15% définis et 11% pour usage privé : il reste de la place. Et non les emojis ne prennent pas beaucoup de place.
  • Par exemple Apple utilise les usages privés pour délivrer le logo Apple dans les fonts du Mac (mais pas ailleurs).
  • UTF est l’encoding du chiffre de l’unicode.
  • UTF-32: 4 bytes tout le temps, UTF-8, encodage variable de 1 à 4 bytes (compatible avec ASCII) ; il a aussi un peu de détection d’erreurs (prefix des bytes différents).
  • Optimisé pour le latin et les textes techniques genre HTML.
  • Problème principal : on ne peut pas déterminer la taille en comptant les bytes, ni aller au milieu d’une chaine directement (variable).
  • UTF-16 utilise 2 ou plus de bytes et est plus sympa pour les caractères asiatiques.
  • Un caractère, c’est en fait un graphème qui peut être fait de plusieurs codepoints : é = e U+0065 + ´ U+0301 ; ☹️ (smiley qui pleure) is U+2639 + U+FE0F.
  • D’ailleurs selon le langage ":man-facepalming::skin-tone-3:".length = 5, 7 en java, 17 en rust ou 1 en swift. Ça dépend de l’encodage de la chaine (UTF-?).
  • ““I know, I’ll use a library to do strlen()!” — nobody, ever.”
  • En java, utiliser ICU.
  • Attention java.text.BreakIterator supporte une vieille version d’Unicode, donc ce n’est pas bon.
  • Les règles de graphème changent à chaque version majeure d’Unicode (tous les ans).
  • Certains caractères comme Å ont plusieurs représentations d’encodage, donc il y a de la normalisation : NFD qui éclate en pleins de codepoints ou NDC qui regroupe au max.
  • Normaliser avant de chercher dans les chaines.
  • Certains Unicode sont représentés différemment selon la LOCALE (c’est la life).
  • Et ça continue dans l’article…

JBang permet d’appeler Java depuis Python via un PyPI https://jbang.dev/learn/python-with-jbang/

  • C’est particulièrement intéressant pour appeler Java depuis son Jupyter notebook.
  • Ça fait un appel à un autre process (mais installe JBang et Java au besoin).

Librairies

Quarkus 3.4 est sorti https://quarkus.io/blog/quarkus-3-4-1-released/

  • Un CVE donc mettez a jour vos Quarkus.
  • Support de Redis 7.2.
  • Plus de granularité sur la désactivation de Flyway globalement ou par data source. Depuis l’activation transparente et automatique en 3.3.
  • quarkus update est l’approche recommandée pour mettre à jour.

Comment tester si un thread virtuel “pin” https://quarkus.io/blog/virtual-threads-3/

  • Exemple avec quarkus.
  • Comment générer la stacktrace.
  • Et un utilitaire JUnit qui fait échouer le test quand le thread pin.
  • Une série d’articles de Clement sur les threads virtuels et comment les utiliser dans quarkus https://quarkus.io/blog/virtual-thread-1/.

À la découverte de LangChain4J, l’orchestration pour l’IA générative en Java https://glaforge.dev/posts/2023/09/25/discovering-langchain4j/

  • Guillaume nous parle du jeune projet LangChain4J, inspiré du projet Python LangChain, qui permet d’orchestrer différents composants d’une chaine d’IA générative.
  • Grâce à ce projet, les développeurs Java ne sont pas en reste, et n’ont pas besoin de se mettre à coder en Python.
  • LangChain4J s’intègre avec différentes bases vectorielles comme Chroma ou WeAviate, ainsi qu’une petite base en mémoire fort pratique.
  • LangChain4J supporte l’API PaLM de Google, mais aussi OpenAI.
  • Il y a différents composants pour charger/découper des documents et pour calculer les vector embeddings des extraits de ces documents.
  • Vidéo enregistrée à Devoxx sur ce thème : https://www.youtube.com/watch?v=ioTPfL9cd9k.

Infrastructure

OpenTF devient OpenTofu https://www.linuxfoundation.org/press/announcing-opentofu

Dans les Dockerfiles, on peut utiliser la notation “heredocs” : <<EOF, des commandes, puis EOF pour indiquer une suite de commandes à exécuter https://www.docker.com/blog/introduction-to-heredocs-in-dockerfiles/

  • C’est comme faire un seul RUN avec des commandes séparées par des &&, mais en plus sympa parce que ça ressemble à un script Bash classique.
  • Par contre, c’est spécifique Docker et ça n’est pas portable sur Podman ou autre.

Docker annonce un nouveau protocole pour signer ses images OpenPubkey https://www.linuxfoundation.org/press/announcing-openpubkey-project

  • Sigstore répond : https://blog.sigstore.dev/openpubkey-and-sigstore/.
  • OpenPubkey s’appuie sur OIDC.
  • C’est un repo GitHub pour l’instant.
  • Pas de tier de confiance en dehors du OIDC provider.
  • OIDC lie une identité à une clé de chiffrement via une extension de l’ID token.
  • OIDC devient une preuve de possession.
  • Purement client side via la signature de l’ID token.
  • Ils utilisent le nonce pour stocker la clé publique et la signer cryptographiquement.
  • Vs Sigstore : plus d’élément central comme le transparency log et l’autorité de certification.
  • Pour le projet Sigstore, ils n’ont pas utilisé cette architecture parce que la privacy des identités, notamment en cas de renommage et sur le long terme, n’est pas respectée.
  • La rotation de clés et la partie client side devient beaucoup plus complexe (OIDC quoi) et ouvre des risques de sécurité (bugs d’implémentation).
  • La clé des OIDC providers est rotatée et ce n’est pas expliqué dans le flow OpenPubkey.
  • La complexité passe de server side à client side (vu que le nonce est la clé du système).
  • Le client notamment va devoir tracker les clés de signature des providers OIDC tout le temps (ou un système devra le faire).
  • L’ID token typiquement a plus d’infos qui vont leaker en tant que certificat du truc signé (privacy).

Cloud

Oracle Cloud rajoute GraalOS https://blogs.oracle.com/java/post/introducing-graalos

  • Plateforme serverless sans container.
  • Application native.
  • En fait des applis compilées avec GraalVM native image.

Web

Comment créer le plus petit conteneur qui sert du contenu statique https://lipanski.com/posts/smallest-docker-image-static-website

  • En utilisant les images Busybox.
  • On peut descendre à environ 150 Ko.
  • À voir la scalabilité.
  • Et les CVEs.

The state of WebAssembly in 2023 https://blog.scottlogic.com/2023/10/18/the-state-of-webassembly-2023.html

  • Rust et JavaScript voient leur popularité lorsqu’ils ciblent Wasm.
  • Wasm est toujours beaucoup utilisé pour le développement web, mais aussi pour le serverless ou comme host pour système de plugins.
  • L’étude montre que les développeurs sont intéressés par les threads, le garbage collection et le nouveau modèle de composants.
  • Côté WASI, toutes les propositions sur le thème I/O retiennent l’attention comme : le support de HTTP, du filesystem, ou les sockets… pourtant, c’est ce que l’approche WASIX proposait, même si elle n’a pas été très bien reçue par la communauté.

Data & IA

AWS investit 4 milliards dans Anthropic.ai et devient actionnaire minoritaire https://twitter.com/didiergirard/status/1706226172428701896?s=61&t=cvEVELchNh1NmF0qxg2GgA

  • Depuis quelque temps, beaucoup de personnes se demandaient où en était AWS dans le domaine GenAI. La réponse vient de tomber.
  • Plutôt que de développer sa propre technologie comme le fait Google, Amazon adopte la stratégie de Microsoft avec OpenAI en investissant dans un pure player et en lui fournissant de la puissance de calcul.
  • AWS deviendra le principal fournisseur cloud d’Anthropic, en fournissant son infrastructure à base de puces AWS Trainium et Inferentia.
  • La technologie d’Anthropic sera ajoutée au catalogue d’Amazon Bedrock. Les entreprises pourront personnaliser et affiner les modèles sur AWS.
  • Claude 2 propose une fenêtre contextuelle de 100 000 tokens, que les entreprises pourront utiliser.
  • Dans le cadre de cet investissement, Amazon acquiert une participation minoritaire dans @AnthropicAI. La structure de gouvernance d’Anthropic reste inchangée.
  • L’annonce : https://www.anthropic.com/index/anthropic-amazon.
  • Merci Didier Girard pour ce résumé.

Article d’opinion : les bases de données vectorielles ne sont pas une catégorie de base de donnée séparée https://nextword.substack.com/p/vector-database-is-not-a-separate

  • On a vu l’émergence de nouvelles bases de données de type vectoriel ces deux dernières années : Pinecone, Milvus, Weaviate, Qdrant…
  • Mais les DB existantes sont toutes en train de rajouter le support des vecteurs dans leur moteur.
  • Pour la “data gravity” : c’est plus facile d’avoir ses données au même endroit que d’en avoir dans différentes bases malgré leur corrélation.
  • Pour capturer le use case de “Retrieval Augmented Generation”, en utilisant les Large Language Model pour récupérer de l’info dans ces bases de données vectorielles.
  • Je pense qu’on verra aussi les DB vectorielles ajouter également plus de fonctionnalités de requêtage qui leur manquent.

Chat GPT: voix et image https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

  • OpenAI a annoncé de nouvelles fonctionnalités vocales et d’image pour ChatGPT.
  • OpenAI a publié un article décrivant leurs efforts de test avec GPT-4V. Ils ont utilisé le modèle dans un outil appelé Be My AI, qui aide les personnes malvoyantes en décrivant le contenu des images : https://cdn.openai.com/papers/GPTV_System_Card.pdf.
  • L’article résume l’évaluation du modèle GPT-4V par OpenAI, qui inclut des tests de comportement, de sécurité, et de capacité médicale, mais conclut que le modèle n’est pas approprié pour des fonctions médicales.

L’IA, c’est pas rentable https://www.tomshardware.com/news/microsoft-lost-money-on-ai

  • Copilot dépense 20$ par utilisateur qui ramène 10$.
  • Il va donc y avoir de la rationalisation après l’acquisition rush d’utilisateurs.
  • En augmentant les prix.
  • En mettant des limites plus restrictives.
  • En utilisant des modèles plus simples et plus légers.
  • Peut-être avec du hardware plus optimisé en coût.
  • C’est intéressant que l’IA est déjà trop puissante pour son coût et pas encore assez pour être suffisante. Loi de Moore ?v
  • MS dit que ce chiffre est faux, mais ne donne pas le vrai chiffre.

Outillage

Amazon acquiert Fig https://techcrunch.com/2023/08/29/amazon-fig-command-line-terminal-generative-ai/

  • On en parlait récemment.
  • C’est un terminal boosté à l’IA.

Introduction de TestContainer Desktop https://www.infoq.com/news/2023/09/testcontainers-desktop/

  • Vient de l’appli proprio TestContainer Cloud Desktop.
  • Permet de mettre les ports fixes (plus facile à debugger).
  • Le gel des containers pour laisser le container tourner pour l’inspection
  • Supporte les moteurs de containers alternatifs à Docker (dont Podman et d’autres que je ne connaissais pas).

Nouvelle version 1.7 de jq, l’outil en ligne de commande pour examiner/modifier vos documents JSON https://github.com/jqlang/jq/releases

  • Utilisation des nombres décimaux pour ne pas perdre de précision.
  • Une fonction pick(stream) pour faire des projections et ne garder que les champs qui nous intéressent.
  • Une fonction debug() pour loguer des messages sur stderr.
  • Une fonction abs() pour calculer la valeur absolue.
  • Et plein d’autres petits raffinements et correctifs de bugs.
  • La version d’avant datait de novembre 2018.

Pratiques de Dogfooding : utiliser tes propres outils comme GitHub utilise GitHub actions pour son propre système CI https://www.infoq.com/news/2023/10/running-GitHub-using-actions/

  • Avoir des runners plus larges.
  • Donner l’accès à des resources privées au runner via une gateway qui reçoit un token OIDC specific au runner.
  • Workflow réutilisables.
  • Sortie de workflows réutilisables pour optimiser si le git id est le même qu’un run ancien.

Sondage de la communauté TestContainer https://www.atomicjar.com/2023/09/state-of-local-development-and-testing-2023/

  • TestContainer pour plus de 10 languages, pas juste Java.
  • RDBMS puis message brokers et les bases nosql sont la majorité des usages.
  • Mais pas que (serveur web, émulateur de cloud, microservices internes).
  • 40% des utilisateurs utilisent autre chose que Docker Desktop (docker engine, podman, rancher etc).
  • TestContainer au moment du dev et pas que pour les tests.

Architecture

Vous êtes plutôt logging ou plutôt tracing ? https://andydote.co.uk/2023/09/19/tracing-is-better/

  • L’article essaie de démontrer que le tracing, c’est mieux que le logging.
  • L’imbrication des traces permet de mieux voir la corrélation que des logs.
  • Les traces donnent des informations de durées, pas que des timestamp.
  • On peut rajouter des attributs à ses traces, ce qui rend plus facile le requêtage, plutôt que de faire des greps sur des messages de log.

Méthodologies

On a construit un produit top et ça a échoué Earthly.dev raconte https://earthly.dev/blog/shutting-down-earthly-ci/

  • Outil de CI/CD qui évite de répéter les tâches…
  • Comme startup, tu ne releases pas un produit mature et complet en fonctionnalités.
  • Mais peut-être 10x meilleur sur une chose spécifique qui peut faire oublier les manques à certains.
  • Quand tu captures ces premiers, tu investis et étends, et tu répètes.
  • Si au début ce différenciateur n’attire personne, ajouter des features ne va pas aider, c’est une recette pour construire quelque chose que personne ne veut.
  • Ils ont construit leur plan de domination en étapes indépendantes, des produits plus focalisés.
  • Et le premier produit “gratuit” ne cannibalisait pas les seconds produits, car ils adressaient différents problèmes (donc pas de risque sur le business model).
  • Le premier produit construit par une personne a été beaucoup adopté.
  • Le deuxième (remote workers) a aussi été adopté avec des gens qui faisaient en DIY, et quand ils ont fait une offre managée, les gens sont venus.
  • Les CI traditionnelles lançaient le job et le reste était délégué à Earthly et Earthly Satellites (le cœur du build).
  • Il ne restait plus qu’à allumer le troisième étage Earthly CI, mais c’est parti en cacahuete.
  • La population intéressée n’était pas des fans qui avaient déjà fait le job du produit, ils demandaient en quoi la CI était différente, le coût de migration et ils n’ont jamais pu gagner.
  • Au lieu d’une grass root install, il y avait un long mur de migration à passer.
  • La clé, c’est que vendre aux devs avec un GTM direct ne marche pas, ils doivent essayer et adopter par eux-mêmes.
  • Les développeurs vont acheter un outil de dev, mais tu ne peux pas leur vendre.

horcrux https://github.com/jesseduffield/horcrux

  • Permet de chiffrer un fichier en plusieurs morceaux, et il faut avoir un certain nombre de fragments pour rassembler le fichier entier.
  • Ne nécessite aucun mot de passe.

Sécurité

Des pseudos chercheurs en sécurité utilisent Bard pour reporter un CVE pour le projet cURL https://hackerone.com/reports/2199174

  • Heureusement, Daniel Steinberg (le créateur de cURL) et les mainteneurs du projet ont rapidement détecté la supercherie.
  • Les LLMs sont super créatifs : ils ont déjà vu dans leur corpus d’entrainement des pages de CVE, et sont donc capables d’en imaginer aussi !
  • Mais imaginez le temps perdu par les mainteneurs de projet OSS s’ils doivent du coup perdre leur temps à vérifier de telles inepties ?
  • Au nez et à la Bard de l’IA.

Loi, société et organisation

Cisco achète Splunk pour 28 milliards https://techcrunch.com/2023/09/21/cisco-to-acquire-splunk-in-28b-mega-deal/

  • Bouge cisco plus dans le software.
  • “synergétique”.
  • Objectif : un géant de l’observabilité et la sécurité.
  • Avec de l’IA parce que c’est comme ça qu’on justifie ces achats.
  • Cet achat doit encore être validé par les autorités de concurrence.
  • Quelque part en 2024.

Les fondations comme Eclipse ont peur du Cyber Résilience Act Européen tel que présenté jusqu’à présent https://newsroom.eclipse.org/news/announcements/cra-should-support-open-practices-open-source-and-development-european-open

  • Ils demandent une clarification sur les contraintes réglementaires.
  • Notamment d’exclure les fondations / associations et laisser le poids sur les sociétés qui fourniraient les projets open sources des fondations dans le cadre d’un accord commercial, pas juste de le fournir en téléchargement.
  • Réutiliser la validation de compliance des sociétés commerciales par les fondations.
  • Autre article de la linux foundation : https://www.linuxfoundation.org/blog/understanding-the-cyber-resilience-act.
  • Fourniture de matchs, auditing, fournir des mises à jour.
  • Bouge la responsabilité de l’utilisateur vers le développeur du logiciel.
  • Un individu qui ne reçoit pas de contribution ni ne fait de consulting ⇒ exclu.
  • Fondations et sociétés commerciales ⇒ inclues.
  • Défini des classes de logiciels de non critique à classe 1 et 2.
  • Doit faire un risk assessment avant de livrer (pas de bug de sécurité, secure par défaut, security update).
  • De la doc sur le process d’évaluation des risques et un SBOM notamment.
  • Notifier d’une vulnérabilité en moins de 24h.
  • Il y a une campagne : #FixTheCRA.

Des protestations contre l’ouverture des modèles d’IA de Meta https://spectrum.ieee.org/meta-ai

  • Ouvrir les modèles et leurs poids permet aux acteurs de bypasser les restrictions (biais etc).
  • Donc des gens de Meta protestent contre la politique open source de Meta dans ce domaine.
  • L’argument, c’est qu’un modèle derrière une API peut être éteint.
  • Les partisans de l’avis contraire pointent que contourner les restrictions de ChatGPT a été trivial jusqu’à présent.
  • Et que l’obscurité amène à un déficit de transparence, de connaissance du public.
  • Va affecter les chercheurs indépendants.
  • Cela dit, ce n’est pas de l’open source pur, car les sources et comment le modèle est entrainé est peu publié.
  • L’OSI travaille à une définition d’Open Source AI.

Un site pour mettre une pause à l’IA https://pauseai.info/

  • NOUS RISQUONS DE PERDRE LE CONTRÔLE
  • NOUS RISQUONS L’EXTINCTION DE L’HUMANITÉ
  • NOUS AVONS BESOIN D’UNE PAUSE
  • NOUS DEVONS AGIR IMMÉDIATEMENT
  • Il y a un agenda des manifestations à travers le monde (Londres, Bruxelles, SFO… mais où est Paris ?).
  • Twitter/Discord/Facebook/TikTok/LinkedIn.
  • Alors qui va gagner la course à l’extinction de l’humanité ? La guerre, le réchauffement climatique ou l’IA ?
  • Sarah Connor !!!

Outils de l’épisode

Un QWERTY adapté pour les lettres à accent https://altgr-weur.eu/ (via Thomas Recloux)

Conférences

Toutes les vidéos de Devoxx Belgique sont disponibles sur https://www.youtube.com/@DevoxxForever.

Hacktoberfest, édition 10 https://hacktoberfest.com/.

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 300 - Interview de Jean-Michel Doudoux sur Java 21 par Charles Sabourdin

Posté le 18/09/2023

Dans cet épisode Charles Sabourdin interview Jean-Michel Doudoux sur la sortie de la nouvelle version LTS de Java en 2023 : Java 21.

Enregistré le 5 septembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-300.mp3

Java 21

The art of long-term support and what LTS means for the Java ecosystem

JDK 21

À propos de Jean-Michel Doudoux

À propos de ParisJug

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 299 - Katia est dans la place !

Posté le 11/09/2023

Dans cet épisode de rentrée, Antonio et Arnaud ont le plaisir d’accueillir Katia Aresti dans l’équipe. Ils passent en revue les dernières nouveautés et sujets chauds de cette rentrée, notamment la sortie de Java 21, les nouvelles versions de Quarkus, Micronaut, Hibernate, NodeJS, Redis, et bien d’autres encore. Ils discutent de sujets plus généraux tels que l’observabilité, la nouvelle tendance “Platform Engineering”, et la productivité des développeurs. Ils abordent aussi les sujets sur la sécurité, tels que les failles sur les CPUs Intel et AMD, ainsi que la vie privée, avec les Tracking APIs de Chrome, Firefox et le projet de loi SREN. Le tout est agrémenté de sa dose d’IA, avec des librairies telles que Semantic Kernel, ainsi que des sujets plus haut niveau tels que Google Gemini, Meta GPT, LLama 2, et les biais et la consommation énergétique de l’IA.

Enregistré le 8 septembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-299.mp3

News

Langages

Apache Groovy a 20 ans! https://twitter.com/ApacheGroovy/status/1695388098950217909

Java 21 arrive le 19 septembre https://www.infoworld.com/article/3689880/jdk-21-the-new-features-in-java-21.html

  • C’est la nouvelle LTS.
  • Pas mal de nouvelles fonctionnalités comme les virtual threads, le pattern matching sur les switch, sequenced collections…
  • Retrouvez le 19 septembre une interview de Jean-Michel Doudoux par Charles Sabourdin pour l’épisode 300 des Cast Codeurs !

Librairies

Semantic Kernel pour Java est (en train de) sortir : https://devblogs.microsoft.com/semantic-kernel/introducing-semantic-kernel-for-java/

  • Framework OSS pour faire de l’IA.
  • .Net et Python.
  • Java 0.2.7 Alpha est publié.
  • Kernel car il est tout petit.
  • Se connecte à plusieurs fournisseurs (aujourd’hui OpenAI, Azure AI, Hugging Face), plusieurs DB vectorielles, plusieurs templates de prompt (suit la specification de OpenAI).

OpenSSL : qui committe ? https://www.openssl.org/blog/blog/2023/07/17/who-writes-openssl/

  • En majorité des OSS payés.
  • Puis des gens payés par leur boite.
  • Et enfin des contributeurs non payés.
  • c’est rapide, mais ça montre que depuis heartbleed, ça a changé

Micronaut 4.1.0 https://micronaut.io/2023/09/01/micronaut-framework-4-1-0-released/

  • Bean Mappers pour créer automatiquement une correspondance entre un type et un autre.
  • Un Introspection Builder : l’annotation @Introspected pour générer un builder dynamique si un type ne peut être construit que via un modèle builder.
  • Améliorations pour les développeurs utilisant Kotlin Symbol Processing (KSP).

Quarkus 3.3.1 / 3.3.2

Hibernate ORM 6.3.0 et 6.2.8 et Hibernate Reactive 2.0.5 https://hibernate.org/orm/

  • Un support initial de la spécification Jakarta Persistence 3.2.
  • Un nouveau guide d’introduction Hibernate 6, un nouveau guide de syntaxe et de fonctionnalités pour le langage de requête Hibernate (Hibernate Query Language).
  • Annotation @Find sur des méthodes → créer des méthodes de recherche similaires aux méthodes de requête.
  • Reactive compatible avec Hibernate ORM 6.2.8, certains changements d’API.

Infrastructure

Une série d’articles sur l’observabilité par Mathieu Corbin

Web

NodeJS 20.6.0 est disponible et ajoute le support des fichiers .env https://philna.sh/blog/2023/09/05/nodejs-supports-dotenv/

  • Configurable avec l’option --env-file.
  • Le fichier .env peut contenir des variables d’environnement et commentaires #.
  • Attention par contre : pas de lignes multiples ni d’extension de variables.
  • Vous pouvez par exemple configurer NODE_OPTIONS avec ce système.

Data

Redis 7.2 est sorti ! https://redis.com/blog/introducing-redis-7-2/

  • Auto-tiering : cette nouvelle fonctionnalité permet de stocker les données sur des supports de stockage différents, en fonction de leur importance et de leur fréquence d’accès. Cela permet d’améliorer les performances et la scalabilité de Redis.
  • RESP3 : cette nouvelle version du protocole RESP permet une communication plus efficace entre Redis et les clients.
  • Improvements to performance : de nombreuses améliorations de performances ont été apportées à Redis 7.2, notamment pour les opérations de lecture et d’écriture.
  • New commands : plusieurs nouvelles commandes ont été ajoutées à Redis 7.2, notamment :
    • CLIENT NO-TOUCH : cette commande permet d’empêcher un client d’être touché par une opération AOF ou RDB.
    • WAITAOF : cette commande permet d’attendre que l’AOF soit écrite avant de poursuivre l’exécution.
  • Dans le podcast sont cités les hot replacement de Redis, comme Dragonfly.

Architecture

Article sur Google Gemini et sa capacité à battre ChatGPT https://www.semianalysis.com/p/google-gemini-eats-the-world-gemini

  • Google a raté les premiers pas (ils avaient le meilleur LLM public avant ChatGPT 3).
  • Et les chercheurs qui inventent les champs de LLMs.
  • Google va 5x ChatGPT-4 avant la fin de l’année, mais vont-ils les publier ?
  • Les chercheurs se tirent la bourre sur le nombre de GPU (H100) auxquels ils ont accès ; ce sont les grosses organisations comme Meta, OpenAI et Google.
  • Et les autres qui luttent avec des GPUs qui n’ont pas assez de VRAM et ce qu’ils vont faire c’est de la merde et sans consequence.
  • Le peuple utilise le modèle dense de LLAMA mais, pour les environnements contraints, ça serait mieux des sparse models et du speculative decoding.
  • Ils devraient se concentrer sur la performance de modèle qui utilise plus de compute et mémoire en évitant de consommer de la bande passante de memoire, c’est ce dont l’edge computing a besoin.
  • Les benchmarks publics ne mesurent pas des choses utiles.
  • Même HuggingFace est dans la category des GPU-poor.
  • Nvidia est en train de se construire une machine de guerre (service).
  • La Chine et les US vont être en compétition, mais l’Europe qui reste GPU-poor ne va pas s’en sortir.
  • Les startups ne peuvent pas payer les GPUs en action, il faut du cash.
  • Tout le monde rempli les poches de Nvidia, sauf Google.
  • Google grossi exponentiellement ses propres GPUs.

Meta GPT https://www.infoq.com/news/2023/08/metagpt-agent-collaboration/

IA : biais et durabilité par Leslie Miley, tech advisor du CTO de Microsoft https://www.infoq.com/presentations/ai-bias-sustainability

  • Nouvelles infrastructures.
  • La consommation énergétique et d’eau des datacenters pour l’IA est terriblement élevée.
  • L’impact des infrastructures sur les communautés (bruit).
  • Explique bien son point de vue sur les problèmes d’amplification des biais de l’IA.
  • Propose des stratégies pour atténuer l’impact.

Kubeflow, le toolkit pour deployer machine learning (ML) workflow en Kubernetes, est accepté par la CNCF https://www.infoq.com/news/2023/08/kubeflow-cncf-project

Méthodologies

Measuring developer productivity? A response to McKinsey by Kent Beck and Gergely Orosz (pragmaticengineer.com) https://tidyfirst.substack.com/p/measuring-developer-productivity

  • McKinsey a sorti un article où ils expliquent la recette miracle recherchée par tous les managers comme le graal : Comment mesurer la productivité des développeurs ? (faut bien vendre du conseil)
  • Kent et Gergely partent d’un modèle mental de description de la création de valeur par le développeur pour ensuite voir quels sont les besoins de mesurer la productivité et comparent cela avec d’autres secteurs (la vente, le support, le recrutement).
  • Ils concluent cette première partie avec les compromis à faire pour que ce type de mesures ait un intérêt sans impacter trop négativement les développeurs.
  • Un autre article dans la même lignée par Martin Fowler : https://martinfowler.com/bliki/CannotMeasureProductivity.html.

Et si on parlait de Platform Engineering ?

On call Process (Astreinte), startup TinyBird par VP Engineering Félix López (ex google, ex eventbrite) https://thenewstack.io/keeping-the-lights-on-the-on-call-process-that-works/

  • Si votre produit est SAAS, on doit avoir des astreintes. Cela impose un lourd fardeau à ceux qui doivent être en astreinte, surtout en petite entreprise.
  • Petites entreprises évitent avoir un processus d’astreinte formel pour éviter le stress. Cela crée dans la pratique plus de stress : si personne n’est responsable, tout le monde est responsable.
  • Tinybird est la plateforme de données en temps réel pour les développeurs et les équipes de données. Pré-création du process formel chez Tinybird : désorganisé, non structuré et stressant.
  • Mise en place : Principes fondamentaux d’un processus d’astreinte : L’astreinte n’est pas obligatoire, minimiser le bruit, pas seulement pour les SRE, alert = runbook, avoir des backups pour la personne en astreinte, appeler quelqu’un devrait être la dernière solution, minimiser le temps en astreinte.
  • L’article explique comment ils sont passés de regarder chaque alerte (comprehensible ?, exploitable ?), puis avoir un board grafana pour chacune et plan spécifique. Une fois le tri fait, tout migré vers un seul channel de com, et manuel d’astreinte pour chaque alerte. Itérer.
  • Multiples benefices sur le long terme : rapports d’incident ouvert, atténuer les problèmes futurs, renforcement la propriété et les connaissances du code et systèmes au sein de toute l’équipe…

Sécurité

Downfall, une nouvelle faille de sécurité sur les processeurs Intel (https://www.lemondeinformatique.fr/actualites/lire-la-faille-downfall-met-a-mal-des-milliards-de-processeurs-intel-91247.html) et AMD ne fait pas mieux avec une faille nommée Inception (https://www.lemondeinformatique.fr/actualites/lire-les-puces-amd-vulnerables-a-la-faille-inception-91273.html)

  • Downfall, La vulnérabilité est due à des fonctions d’optimisation de la mémoire dans les processeurs Intel qui révèlent involontairement les registres matériels internes aux logiciels. Cela permet à des logiciels non-fiables d’accéder à des données stockées par d’autres programmes, qui ne devraient normalement pas être accessibles. Tous les PC ou ordinateurs portables équipés de processeurs Intel Core de la 6e génération Skylake jusqu’aux puces Tiger Lake de 11e génération incluses contiennent cette faille. Les derniers processeurs Core 12e et 13e génération d’Intel ne sont pas concernés.
  • Inception, nécessite un accès local au système pour être potentiellement exploité ce qui en limite de fait la portée. Tous les processeurs AMD depuis 2017 sont touchés, incluant les derniers modèles Zen 4 Epyc et Ryzen.

Comment désactiver le nouveau tracking publicitaire ciblé sur Chrome https://www.blogdumoderateur.com/chrome-comment-desactiver-tracking-publicitaire-cible/

  • Google a annoncé en juillet le déploiement de sa nouvelle API Topics, permettant « à un navigateur de partager des informations avec des tiers sur les intérêts d’un utilisateur tout en préservant la confidentialité ».
  • C’est cette API, incluse dans la version Chrome 115 de juillet 2023, qui est censée remplacer les cookies tiers.

Loi, société et organisation

Une nouvelle definition d’open pour Llama 2 ? https://opensourceconnections.com/blog/2023/07/19/is-llama-2-open-source-no-and-perhaps-we-need-a-new-definition-of-open/

  • C’est relativement “open” mais il y a des restrictions, donc pas open source.
  • Pas plus de 700 M d’utilisateurs par mois.
  • Pas le droit d’utiliser Llama pour améliorer des autres modèles autres que des dérivés de Llama.
  • Et c’est le modèle final qui est ouvert, pas la sauce pour le construire, donc pas de maven build ni le “source code” pour y arriver “from scratch”.
  • Attention au risque de sacrifier l’open source pour avoir l’IA plus vite, plus facile.

HashiCorp passe tous ses projets open source en BSL, comme Confluent, Mongo, Redis, Elastic… https://thenewstack.io/hashicorp-abandons-open-source-for-business-source-license/

Stack overflow annonce Overflow AI https://www.infoq.com/news/2023/09/stackoverflow-overflowai/

  • L’intégration de l’IA générative dans leur plateforme publique, Stack Overflow for Teams, ainsi que de nouveaux domaines de produits.
  • IA/ML aident à générer des balises initiales et à suggérer des paires question-réponse, permettant aux développeurs de se concentrer sur l’amélioration et la précision.
  • Amélioration des capacités de recherche.
  • Les forums de questions-réponses basés sur la communauté sont le cœur battant de Stack Overflow. Selon Prashanth Chandrasekar, PDG de Stack Overflow, l’objectif d’OverflowAI est d’améliorer la communauté de diverses manières plutôt que de la remplacer complètement.

Vous avez entendu parler du projet de loi SREN ? http://share.mozilla.org/817319645t

  • Le gouvernement français prépare une loi qui pourrait menacer la liberté sur Internet. Le projet de loi visant à sécuriser et réguler l’espace numérique (SREN) obligerait les navigateurs web, comme Mozilla Firefox, à bloquer des sites web directement au niveau du navigateur.
  • Mozilla lance une pétition pour retirer cette énième solution stupide pour censurer Internet.

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 298 - De l'IA à toutes les sauces

Posté le 24/07/2023

Dans cet épisode estival Guillaume, Emmanuel et Arnaud parcourent les nouvelles du début d’été. Du Java, du Rust, du Go du côté des langages, du Micronaut, du Quarkus pour les frameworks, mais aussi du WebGPU, de l’agilité, du DDD, des sondages, de nombreux outils et surtout de l’intelligence artificielle à toutes les sauces (dans les bases de données, dans les voitures…).

Enregistré le 21 juillet 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-298.mp3

News

Langages

La release candidate de Go 1.21 supporte WASM et WASI nativement https://go.dev/blog/go1.21rc

StringBuilder ou concatenation de String https://reneschwietzke.de/java/the-stringbuilder-advise-is-dead-or-isnt-it.html

  • StringBuilder était la recommendation car ça créait moins d’objets notamment.
  • Mais la JVM a évolué et le compilateur ou JIT remplace cela par du code efficace.
  • Quelques petites exceptions.
  • Le code froid (c.-à-d. startup time) qui est encore interprété peut bénéficier de StringBuilder.
  • Autre cas, la concatenation dans des boucles où le JIT ne pourrait peut-être pas optimiser.
  • Le StringBuilder “fluid” est plus efficace (inliné ?).
  • Ces règles ne changent pas si des objets sont stringifié pour être concaténés.

GPT-4 n’est pas une révolution https://thealgorithmicbridge.substack.com/p/gpt-4s-secret-has-been-revealed

  • Rumeurs, car beaucoup de secrets autour de GPT-4
  • Pas un modèle à 1 trillion de paramètres, mais 8 à 220 milliards combinés intelligemment.
  • Les chercheurs attendaient un breakthrough mais c’est une évolution et pas particulièrement nouveau.
  • Méthode déjà implémentée par des chercheurs chez Google (maintenant chez OpenAI).
  • Ils ont retardé la compétition avec ces rumeurs de breakthrough, mais 8 LLaMA peuvent peut-être rivaliser avec GPT-4.

Le blog Open Source de Google propose un article sur 5 mythes ou non sur l’apprentissage et l’utilisation de Rust https://opensource.googleblog.com/2023/06/rust-fact-vs-fiction-5-insights-from-googles-rust-journey-2022.html

  • Il faut plus de 6 mois pour apprendre Rust : plutôt faux ; quelques semaines à 3-4 mois max.
  • Le compilateur Rust n’est pas aussi rapide qu’on le souhaiterait — vrai !
  • Le code unsafe et l’interop sont les plus gros challenges — faux, ce sont plutôt les macros, l’ownership/borrowing et la programmation asynchrone.
  • Rust fournit des messages d’erreur de compilation géniaux — vrai.
  • Le code Rust est de haute qualité — vrai.

InfoQ sort un nouveau guide sur le Pattern Matching pour le switch de Java https://www.infoq.com/articles/pattern-matching-for-switch/

  • Le pattern matching supporte tous les types de référence.
  • L’article parle du cas de la valeur null.
  • L’utilisation des patterns “guarded” avec le mot clé when.
  • L’importance de l’ordre des cases.
  • Le pattern matching peut être utilisé aussi avec le default des switchs
  • Le scope des variables du pattern.
  • Un seul pattern par case label.
  • Un seul case match-all dans un bloc switch.
  • L’exhaustivité de la couverture des types.
  • L’utilisation des generics.
  • La gestion d’erreur avec MatchException.

Librairies

Sortie de Micronaut 4 https://micronaut.io/2023/07/14/micronaut-framework-4-0-0-released/

  • Langage minimal : Java 17, Groovy 4 et Kotlin 1.8.
  • Support de la dernière version de GraalVM.
  • Utilisation des GraalVM Reachability Metadata Repository pour faciliter l’utilisation de Native Image.
  • Gradle 8.
  • Nouvel Expression Language, à la compilation, pas possible au runtime (pour des raisons de sécurité et de support de pré-compilation).
  • Support des Virtual Threads.
  • Nouvelle couche HTTP, éliminant les stack frames réactives quand on n’utilise pas le mode réactif.
  • Support expérimental de IO Uring et HTTP/3.
  • Des filtres basés sur les annotations.
  • Le HTTP Client utilise maintenant le Java HTTP Client.
  • Génération de client et de serveur en Micronaut à partir de fichier OpenAPI.
  • L’utilisation YAML n’utilise plus la dépendance SnakeYAML (qui avait des problèmes de sécurité).
  • Transition vers Jakarta terminé
  • Et plein d’autres mises à jour de modules
  • Couverture par InfoQ https://www.infoq.com/news/2023/07/micronaut-brings-virtual-thread/

Quarkus 3.2 et LTS

Infrastructure

Red Hat partage les sources de sa distribution au travers de son Customer Portal, et impacte la communauté qui se base dessus https://almalinux.org/blog/impact-of-rhel-changes/

  • RedHat a annoncé un autre changement massif qui affecte tous les rebuilds et forks de Red Hat Enterprise Linux.
  • À l’avenir, Red Hat publiera uniquement le code source pour les RHEL RPMs derrière leur portail client.
  • Comme tous les clones de RHEL dépendent des sources publiées, cela perturbe encore une fois l’ensemble de l’écosystème Red Hat.

Une analyse du choix de Red Hat sur la distribution du code source de RHEL https://dissociatedpress.net/2023/06/24/red-hat-and-the-clone-wars/

Une réponse de Red Hat aux feux démarrés par l’annonce de la non-distribution des sources de RHEL en public https://www.redhat.com/en/blog/red-hats-commitment-open-source-response-gitcentosorg-changes

Et un lien vers un de ces feux d’une personne proéminente dans la communauté Ansible https://www.jeffgeerling.com/blog/2023/im-done-red-hat-enterprise-linux

Oracle demande à garder un Linux ouvert et gratuit https://www.oracle.com/news/announcement/blog/keep-linux-open-and-free-2023-07-10/

  • Suite à l’annonce d’IBM/RedHat, Oracle demande à garder Linux ouvert et gratuit.
  • IBM ne veut pas publier le code de RHEL car elle doit payer ses ingénieurs.
  • Alors que RedHat a pu maintenir son modèle économique durant des années.
  • L’article revient sur CentOS qu’IBM “a tué” en 2020.
  • Oracle continu ses efforts de rendre Linux ouvert et libre.
  • Oracle Linux continuera à être compatible avec RHEL jusqu’à la version 9.2. Après, ça sera compliqué de maintenir une compatibilité.
  • Oracle embauche des devs Linux.
  • Oracle demande à IBM de récupérer le downstream d’Oracle et de le distribuer.

SUSE forke RHEL https://www.suse.com/news/SUSE-Preserves-Choice-in-Enterprise-Linux/

  • SUSE est la société derrière Rancher, NeuVector, et SUSE Linux Enterprise (SLE).
  • Annonce un fork de RHEL.
  • $10M d’investissement dans le projet sur les prochaines années.
  • Compatibilité assurée de RHEL et CentOS.

Web

Google revend son service de nom de domaine à Squarespace https://www.reddit.com/r/webdev/comments/14agag3/squarespace_acquires_google_domains/

  • et ça n’était pas gratuit, donc on n’est pas censé être le produit 😉
  • Squarespace est une entreprise américaine spécialisée dans la création de sites internet.
  • Squarespace est un revendeur de Google Workspace depuis longtemps.
  • La vente devrait se finaliser en Q3 2023.

Petite introduction à WebGPU en français https://blog.octo.com/connaissez-vous-webgpu/

Data

Avec la mode des Large Language Models, on parle de plus en plus de bases de données vectorielles, pour stocker des “embeddings” (des vecteurs de nombre flottant représentant sémantiquement du texte, ou même des images). Un article explique que les Vecteurs sont le nouveau JSON dans les bases relationnelles comme PostgreSQL https://jkatz05.com/post/postgres/vectors-json-postgresql/

Outillage

Le sondage de StackOverflow 2023 https://survey.stackoverflow.co/2023/

  • L’enquête a été réalisée auprès de 90 000 développeurs dans 185 pays.
  • Les développeurs sont plus nombreux (+2%) que l’an dernier à travailler sur site (16% sur site, 41% remote, 42% hybrid).
  • Les développeurs sont également de plus en plus nombreux à utiliser des outils d’intelligence artificielle, avec 70 % d’entre eux déclarant les utiliser (44%) ou prévoyant de les utiliser (25) dans leur travail.
  • Les langages de programmation les plus populaires sont toujours JavaScript, Python et HTML/CSS.
  • Les frameworks web les plus populaires sont Node, React, JQuery.
  • Les bases de données les plus populaires sont PostgreSQL, MySQL, et SQLite.
  • Les systèmes d’exploitation les plus populaires sont Windows puis macOS et Linux.
  • Les IDE les plus populaires sont Visual Studio Code, Visual Studio et IDEA IntelliJ.

Les différents types de déplacement dans Vim https://www.barbarianmeetscoding.com/boost-your-coding-fu-with-vscode-and-vim/moving-blazingly-fast-with-the-core-vim-motions/

JetBrains se met aussi à la mode des assistants IA dans l’IDE https://blog.jetbrains.com/idea/2023/06/ai-assistant-in-jetbrains-ides/

  • Une intégration avec OpenAI, mais aussi de plus petits LLMs spécifiques à JetBrains.
  • Un chat intégré pour discuter avec l’assistant, puis la possibilité d’intégrer les snippets de code là où se trouve le curseur.
  • Possibilité de sélectionner du code et de demander à l’assistant d’expliquer ce que ce bout de code fait, mais aussi de suggérer un refactoring, ou de régler les problèmes potentiels.
  • On peut demander à générer la JavaDoc d’une méthode, d’une classe, etc, ou à suggérer un nom de méthode (en fonction de son contenu).
  • Génération de message de commit.
  • Il faut avoir un compte JetBrains AI pour y avoir accès.

Des commandes macOS plus ou moins connues https://saurabhs.org/advanced-macos-commands

  • caffeinate — pour garder le mac éveillé,
  • pbcopy / pbpaste — pour interagir avec le clipboard,
  • networkQuality — pour mesurer la rapidité de l’accès à internet,
  • sips — pour manipuler / redimensionner des images,
  • textutil — pour convertir des fichiers Word, texte, HTML,
  • screencapture — pour faire un screenshot,
  • say — pour donner une voix à vos commandes.

Le sondage de la communauté ArgoCD https://blog.argoproj.io/cncf-argo-cd-rollouts-2023-user-survey-results-514aa21c21df

Un client d’API open-source et cross platform pour GraphQL, REST, WebSockets, Server-sent events et gRPC https://github.com/Kong/insomnia

Architecture

Moderniser l’architecture avec la découverte via le domain driven discovery https://www.infoq.com/articles/architecture-modernization-domain-driven-discovery/

  • Un article très détaillé pour moderniser son architecture en utilisant une approche Domain-Driven Discovery qui se fait en 4 étapes : 1- Encadrer le problème – Clarifier le problème que vous résolvez, les personnes touchées, les résultats souhaités et les contraintes de solution. 2- Analyser l’état actuel – Explorer les processus opérationnels et l’architecture des systèmes existants afin d’établir une base de référence pour l’amélioration. 3- Explorer l’état futur – Concevoir une architecture modernisée fondée sur des contextes délimités, établir des priorités stratégiques, évaluer les options et créer des solutions pour l’état futur. 4- Créer une feuille de route – Créer un plan pour moderniser l’architecture au fil du temps en fonction des flux de travail ou des résultats souhaités.

Récemment, Sfeir a lancé son blog de développement sur https://www.sfeir.dev/

  • Plein d’articles techniques sur de nombreux thèmes : front, back, cloud, data, AI/ML, mobile.
  • Aussi des tendances, des success stories…
  • Par exemple dans les derniers articles : on parle d’Alan Turing, du Local Storage en Javascript, de la préparation de certifications React, l’impact de la cybersécurité sur le cloud.

Demis Hassabis annonce travailler sur une IA nommée Gemini qui dépassera ChatGPT https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/

  • Demis Hassabis CEO de Google DeepMind créateur de AlphaGO et AlphaFold.
  • Travaille sur une IA nommée Gemini qui dépasserait ChatGPT de OpenAI.
  • Similaire à GPT-4, mais avec des techniques issues de AlphaGO.
  • Encore en développement, va prendre encore plusieurs mois.
  • Un remplaçant à Bard ?

Méthodologies

Approcher l’agilité par les traumatismes (de développement) passés des individus https://www.infoq.com/articles/trauma-informed-agile/?utm_campaign=infoq_content&utm_source=twitter&utm_medium=feed&utm_term=culture-methods

  • Nous subissons tous un traumatisme du développement qui rend difficile la collaboration avec d’autres - une partie cruciale du travail dans le développement de logiciels agiles.
  • Diriger d’une manière tenant compte des traumatismes, ça n’est pas pratiquer la psychothérapie non sollicitée, et ça ne justifie pas les comportements destructeurs sans les aborder.
  • Être plus sensible aux traumatismes dans votre leadership peut aider tout le monde à agir de façon plus mature et plus disponible sur le plan cognitif, surtout dans des situations émotionnellement difficiles.
  • Dans les milieux de travail tenant compte des traumatismes, les gens accordent plus d’attention à leur état physique et émotionnel.
  • Ils s’appuient aussi davantage sur le pouvoir de l’intention, fixent des objectifs d’une manière moins manipulatrice et sont capables d’être empathiques sans s’approprier les problèmes des autres.

Loi, société et organisation

Mercedes va rajouter de l’intelligence artificielle dans ses voitures https://azure.microsoft.com/en-us/blog/mercedes-benz-enhances-drivers-experience-with-azure-openai-service/

  • Programme beta-test de 3 mois pour le moment.
  • Assistance vocale “Hey Mercedes”.
  • Permet de discuter avec la voiture pour trouver son chemin, concocter une recette, ou avoir tout simplement des discussions.
  • Ils travaillent sur des plugins pour réserver un resto, acheter des tickets de cinéma.

Free software vs Open Source dans le contexte de l’intelligence artificielle par Sacha Labourey https://medium.com/@sachalabourey/ai-free-software-is-essential-to-save-humanity-86b08c3d4777

  • On parle beaucoup d’IA et d’open source.
  • Mais il manque la dimension de contrôle des utilisateurs finaux.
  • Stallman a créé la FSF par peur de la notion d’humain augmenté par des logiciels qui sont contrôlés par d’autres (implants dans le cerveau etc).
  • D’où la GPL et sa viralité qui propage la capacité à voir et modifier le code que l’on fait tourner.
  • Dans le débat IA, ce n’est pas seulement Open Source (casser l’oligopolie) mais aussi le Free Software qui est en jeu.

La folie du Cyber Resilience Act (CRA) européen https://news.apache.org/foundation/entry/save-open-source-the-impending-tragedy-of-the-cyber-resilience-act

  • Au sein de l’UE, la loi sur la cyber-résilience (CRA) fait maintenant son chemin à travers les processus législatifs (et doit faire l’objet d’un vote clé le 19 juillet 2023). Cette loi s’appliquera à un large éventail de logiciels (et de matériel avec logiciel intégré) dans l’UE. L’intention de ce règlement est bonne (et sans doute attendue depuis longtemps) : rendre le logiciel beaucoup plus sûr.
  • Le CRA a une approche binaire : oui/non et considère tout le monde de la même manière.
  • Le CRA réglementerait les projets à source ouverte à moins qu’ils n’aient « un modèle de développement entièrement décentralisé ». Mais les modèles OSS sont de complexes mélanges de pur OSS et éditeurs de logiciels.
  • les entreprises commerciales et les projets open source devront être beaucoup plus prudents quant à ce que les participants peuvent travailler sur le code, quel financement ils prennent, et quels correctifs ils peuvent accepter.
  • Certaines des obligations sont pratiquement impossibles à respecter, par exemple l’obligation de « livrer un produit sans vulnérabilités exploitables connues ».
  • Le CRA exige la divulgation de vulnérabilités graves non corrigées et exploitées à l’ENISA (une institution de l’UE) dans un délai mesuré en heures, avant qu’elles ne soient corrigées (complètement opposé aux bonnes pratiques de sécu).
  • Une fois de plus une bonne idée à l’origine, mais très mal implémentée qui risque de faire beaucoup de dommages.

Octave Klaba, avec Miro, son frère, et la Caisse des Dépôts, finalisent la création de Synfonium qui va maintenant racheter 100% de Qwant et 100% de Shadow. Synfonium est détenue à 75% par Jezby Venture et Deep Code et à 25% par la CDC. https://twitter.com/i/web/status/1673555414938427392

  • L’un des rôles de Synfonium est de créer la masse critique des utilisateurs et des clients B2C et B2B qui vont pouvoir utiliser tous ces services gratuits et payants.
  • Vous y retrouverez le moteur de recherche, les services gratuits, la suite collaborative, le social login, mais aussi les services de nos partenaires tech.
  • Le but est de créer une plateforme dans le Cloud SaaS EU qui respecte nos valeurs et nos lois européennes.

Yann LeCun : « L’intelligence artificielle va amplifier l’intelligence humaine » https://www.europe1.fr/emissions/linterview-politique-dimitri-pavlenko/yann-lecun-lintelligence-artificielle-va-amplifier-lintelligence-humaine-4189120

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 297 - Lockless design

Posté le 12/06/2023

Guillaume, Arnaud et Emmanuel discutent des nouvelles de mai et juin. La communauté Rust, WebAssembly. Guava, Debezium, Kafka, de flame graph, d’open source et bien sûr les large language models. On répond aussi à la question fondamentale : mais pourquoi Maven n’a pas de fichier .lock ?

Enregistré le 9 juin 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-297.mp3

News

Langages

Lors de Microsoft BUILD 2023, un des fondateurs de OpenAI a fait une excellente présentation de Large Language Models, des GPT https://build.microsoft.com/en-US/sessions/db3f4859-cd30-4445-a0cd-553c3304f8e2

  • Il parle du fonctionnement des LLM, comment/pourquoi ils arrivent à générer ce qu’ils génèrent.
  • Le fine-tuning, l’apprentissage renforcé avec feedback humain, l’art du prompting.
  • Des patterns comme Chain of Thought (CoT) ou ReAct (Reflect then Act).

Leaning Technologies annonce l’arrivée prochaine de CheerpJ 3 : le retour de Java dans le navigateur, grâce à WebAssembly https://leaningtech.com/announcing-cheerpj-3-0-a-jvm-replacement-in-html5-and-webassembly-to-run-java-applications-and-applets-on-modern-browsers/

  • Avant la version 3.0, CheerpJ utilisait une approche AOT (Ahead Of Time compilation) qui nécessitait aussi une étape d’intégration continue pour transformer aussi toutes les dépendances JAR associées à un projet.
  • Avec la version 3.0, qui devrait sortir cet été, CheerpJ adopte une approche JIT (Just-In-Time compilation) qui ressemble plus à l’approche de Java lui-même.
  • Plus besoin non plus de version custom d’OpenJDK.
  • Les Applets vous avaient manqué ? Elles sont de retour avec WebAssembly 😀.

Communauté RUST : Il y a de l’eau dans le gaz https://www.jntrnr.com/why-i-left-rust/

  • Plus d’infos sur https://gist.github.com/fasterthanlime/42da9378768aebef662dd26dddf04849.
  • Lié au backchannel et un petit groupe qui essaie de faire les choses bien, mais qui dérape de l’extérieur.
  • En gros, ils ont un process interne pour prendre des décisions.
  • Avec ce process, ils ont invité une personne pas super pro-Rust à faire la keynote à RustConf.
  • D’autres membres du commité ont vu ça et ont discuté en backchannel pour annuler la décision (sans suivre le process).
  • Il y a eu une semaine de pause avant action, mais pas d’annonce.
  • Le speaker a été dékeynoté et a donc refusé de venir à la conférence.
  • Et paf ! Ça énerve des gens décisionnaire et ils démissionnent.
  • Bref des gens qui veulent faire bien, mais en cercle un peu trop fermé.

Les gens de Wasmer étendent WASI avec WASIX, en rajoutant le support POSIX, les threads… permettant de compiler vers WASM plein de projet C/C++ ou Rust, comme cURL https://wasmer.io/posts/announcing-wasix

  • Ça frotte un peu entre innovation et standardisation dans la communauté WASM.
  • WASMER sont un peu les cowboys startuper.
  • Par exemple, ils ont essayé de déposer la marque WebAssembly au nez et à la barbe de la communauté.
  • Donc la reaction du cœur de la communauté face à cette annonce est plutôt calme.
  • WASI c’est standard, mais ça prend du temps à maturer.
  • WASIX c’est cool et disponible maintenant, mais c’est un produit d’une société spécifique, donc pas de portabilité.

Librairies

Guava 32 est sorti et beaucoup de choses annotées en @Beta ne le sont plus https://www.reddit.com/r/java/comments/13w2l8w/guava_320_released_today_and_the_beta_annotation/

  • Ils ont eu des API en @Beta pendant longtemps pour protéger des risques de changements.
  • En pratique quasi personne ne se limitait au non-beta, et ces API n’ont pas ou peu bougé.
  • Ils ont donc enlevé @Beta de la plupart des API.
  • Beaucoup de parties de Guava sont dans le JDK, le cache est dans Caffeine.
  • De bons échanges dans les commentaires entre les utilisateurs et Kevin, un des mainteneurs chez Google

Comment démarrer avec l’API PaLM de Google, mais en Java ! https://glaforge.dev/posts/2023/05/30/getting-started-with-the-palm-api-in-the-java-ecosystem/

Infrastructure

Debezium 2.2 https://debezium.io/blog/2023/04/20/debezium-2-2-final-released/

  • Experimental opt-in Parallel Snapshots,
  • Incremental snapshots with surrogate keys,
  • Quarkus 3 support,
  • Ingestion of Oracle changes from logical standby instances,
  • Google Spanner improvements,
  • New Debezium Server sinks for Infinispan, RabbitMQ, and RocketMQ,
  • New Storage APIs for Amazon S3 and RocketMQ,
  • Many MongoDB improvements,
  • Cassandra connector for Cassandra Enterprise.

Un article sur l’utilisation de Kafka par CloudFlare https://www.infoq.com/articles/kafka-clusters-cloudflare/

  • C’est du “classique”, mais bon de se le faire rappeler.
  • Beaucoup d’évènements CloudFlare ne passent pas Kafka pour processing.
  • Kafka en tant que bus générique.
  • Ils ont imposé un message unique par topic via Protobuf.
  • Ils ont une Application Service team (internal developer platform) depuis peu de temps.
  • GitOps pour création de topic…
  • Ils ont développé un connector framework déclaratif pour étendre le panel de patrons d’architecture disponibles.
  • Ils ont développé des SDKs d’accès à Kafka avec monitoring (Prometheus).
  • Sympa à lire.

Post mortem du problème chez Datadog https://www.datadoghq.com/blog/2023-03-08-multiregion-infrastructure-connectivity-issue/

  • Datadog a perdu tous ses services dans la plupart de ses regions pendant 3 heures avant la première récupération et 10 heures au total pour la récupération totale.
  • Équipe : 10 senior engineering leaders, about 70 local incident commanders and a pool of 450 to 750 incident responders active throughout the incident, which required four shifts to bring the incident to full resolution.
  • Cause : une mise à jour de systemd appliquée sur la plupart de leurs VM en quasi parallèle qui a effacé les routes des conteneurs et ne les a pas remis ; c’est un cas qui n’arrive pas au reboot d’un nœud (init sequence).
  • Des dizaines de milliers de nœuds ont été impactés.
  • En général, ils font du rollout par région en enlevant les nœuds etc, mais le base OS avait un legacy update channel activé (vs géré par les équipes de Datadog manuellement).
  • Les nœuds de controllers qui sont censés recycler les nœuds n’ont pu le faire vu le nombre de nœuds et surtout parce qu’eux-mêmes étaient affectés.
  • L’autre article.

Cloud

Le datacenter parisien europe-west9-a est en panne depuis 3 semaines https://www.lebigdata.fr/data-center-panne

  • Un feu s’est déclenché et a touché une zone.
  • Le datacenter reste opérationnel sur les zones non touchées, sauf BigTable qui a besoin de la zone touchée.
  • Les autres services fonctionnent, sauf les applis utilisateurs qui ne tournaient que sur la zone affectée.

Outillage

Podman Desktop 1.0 est sorti https://podman-desktop.io/blog/podman-desktop-release-1.0

  • Pas grand-chose d’autre à dire que c’est la 1.0.
  • “Works on my machine”

Contract testing with Pact https://hollycummins.com/contract-testing-devoxx-greece/

  • Conférence.
  • Quand on change un microservice l’autre casse.
  • Les tests d’integration sont lents, instables et demandent de grosses machines ou des environnements remote de dev.
  • Mock / unit tests ne sont pas vraiment le code de l’autre équipe.
  • D’où les contract tests qui vivent entre les tests end to end et les tests unitaires.
  • Peut partir d’un test mock et remplacer avec pact côté consommateur.
  • En faisant tourner un pact listener qui enregistre la déclaration et les retours attendus / générés par l’appel du test.
  • Copier ce fichier vers le producteur.
  • Copier à la main, dans le repo, via un broker.
  • Ajoute un test pact côté producteur qui va exercer le JSON et vérifier que cela marche.
  • Tests de pact sont plus profonds qu’un test OpenAPI.
  • Consommateur utilise pact comme mock et vérifie le provider avec le contract du mock.

Pourquoi Maven n’a pas de fichier lock ? https://www.reddit.com/r/Maven/comments/vkcmys/why_maven_doesnt_have_a_lock_file_like/

  • Conversation intéressante sur les fichiers .lock dans les builds.
  • Par exemple Ruby a le Gemfile.lock, npm pareil, mais pas Java ?
  • Fondamentalement, c’est dû aux valeurs par défaut initiales et à la culture de la communauté.
  • Les versions range sont peu ou pas utilisés en Maven.
  • Alors que c’est l’approche par défaut sur d’autres plateformes
  • La poule et l’œuf.

Simplifier les flame graph avec JBang https://someth2say.wordpress.com/2023/06/04/jbang-and-flame-graphs/

  • Discute des flame graph.
  • Pour le temps consommé et pas un call graph.
  • En hauteur, c’est la profondeur d’appel.
  • Ne regarder que la largeur, pas l’ordre.
  • Pas quand et où une action est faite, mais qui l’a faite.
  • Le reste discute de la manière d’utiliser JBang pour lancer le programme et le javaagent.

Les modérateurs de Stack Overflow en grève contre le flux de réponses d’intelligence artificielle https://openletter.mousetail.nl/

  • Le ban des contenus générés par l’IA a été levé discrètement par Stack Overflow.
  • Peur du flux de données massif et des hallucinations difficiles à détecter sans passer du temps.
  • Pas de consensus communautaire.
  • Stack Overflow est une des sources trustées pour les LLM des intelligences artificielles génératives (serpent qui se mord la queue).
  • Les modérateurs font tourner l’anti-spam, gèrent les flags levés, ferment ou effacent les entrées, genre les bots qui détectent le plagiat…
  • 414 votants dès les premières heures.

Just, un petit outil en ligne de commande avec une syntaxe inspirée de make, pour exécuter des commandes fréquentes dans nos projets https://glaforge.dev/posts/2023/06/07/just-a-handy-command-line-tool/

  • Syntaxe proche de celle de make.
  • Possibilité de définir des dépendances entre tâches.
  • Support de paramètres.
  • Peut charger des fichier .env.
  • S’installe sur tous les systèmes d’exploitation qu’on aime bien (et qu’on n’aime pas aussi).

Méthodologies

AWS retire ses documentations en Open Source https://www.infoq.com/news/2023/06/aws-documentation-github/

  • Ils ont open-sourcé en espérant des contributions il y a deux ans, mais sans changer les approches en interne.
  • Résultat : copie de repos de l’intérieur vers l’extérieur.
  • Tracker de travail interne != externe.
  • C’était plus compliqué.
  • Leçon, embrasser entièrement sinon les frictions sont compliquées.

Un guide pour communiquer avec l’IA https://learnprompting.org/

  • Gratuit et open source.
  • Prompt Engineering ou comment rédiger vos prompts.
  • Plusieurs niveaux (Basic, Intermédiaire, Avancé..).
  • Défini plein de concepts: Prompt, Few Shot Prompt, LLMs…

Loi, société et organisation

Migration de Twitter vers Mastodon (ou plutôt “dual run”) https://glaforge.dev/talks/2023/06/09/from-bird-to-elephant-starting-a-new-journey-on-mastodon/

Conférences

Aurelie Vache publie son agenda des conferences via le site: https://developers.events/

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 296 - Interview Google IA IA I/O 2023

Posté le 25/05/2023

Dans cet épisode, Antonio, Emmanuel et Guillaume reviennent sur les nouveautés et annonces faites à Google I/O 2023 : de nouveaux téléphones Pixel qui se plient ou pas, et surtout de l’intelligence artificielle du sol au plafond ! Que ce soit dans Android, dans Google Workspace, dans Google Cloud, une tonne de produits passe en mode survitaminé à l’IA. Guillaume, Antonio et Emmanuel discutent aussi de l’impact qu’ils voient sur l’AI, et de comment les Large Language Models sont raffinés et pourquoi on les fait halluciner, de subtilités du langage des signes.

Enregistré le 23 mai 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-296.mp3

Google I/O 2023

Site web : https://io.google/2023/

Keynote principale : https://io.google/2023/program/396cd2d5-9fe1-4725-a3dc-c01bb2e2f38a/

Keynote développeur : https://io.google/2023/program/9fe491dd-cadc-4e03-b084-f75e695993ea/

Vidéo résumée en 10 minutes de toutes les annonces : https://www.youtube.com/watch?v=QpBTM0GO6xI&list=TLGGCy91ScdjTPYxNjA1MjAyMw

Vidéo de toutes les sessions techniques : https://io.google/2023/program/?q=technical-session

Google I/O s’est tenu il y a 10 jours en Californie, dans l’amphithéâtre de Shoreline, près du campus de Google.

Seulement 2000 personnes sur place, un chat et un jeu en ligne pour assister à distance.

Jeu en ligne I/O Flip créé avec Flutter, Dart, Firebase, et Cloud Run, et tous les assets graphiques générés par Generative AI https://blog.google/technology/ai/google-card-game-io-flip-ai/

Des Pixels plein les yeux !

Des détails sur le design des nouveaux appareils : https://blog.google/products/pixel/google-pixel-fold-tablet-7a-design/

Pixel Fold

Article : https://blog.google/products/pixel/google-pixel-fold/

  • Premier téléphone foldable de Google (après Samsung et Oppo)
  • Un écran sur le dessus, et un grand écran pliable à l’intérieur
    • Pratique pour la traduction où peut voir une discussion traduire en deux langues d’un côté sur un écran et dans l’autre langue sur l’autre
  • Utilisation créative de la pliure : mode “laptop”, pour les selfies, pour poser l’appareil pour des photos de nuit
  • Par contre… pas disponible en France, et tout de même presque 1900€ !

Pixel Tablet

Article : https://blog.google/products/pixel/google-pixel-tablet/

  • Une belle tablette de 11 pouces, avec un dock de recharge avec enceinte intégrée
  • Processeur Tensor G2, Chromecast intégré
  • C’est un peu comme le Google Nest Hub Max, mais avec un écran détachable
  • Une coque pratique avec un trépied intégré et qui n’empêche pas de recharger la tablette sur le dock
  • En mode dock, c’est comme l’écran du Google Home App, et dès qu’on la décroche, on est en mode multi-utilisateur, chacun avec son profil

Pixel 7a

Article : https://blog.google/products/pixel/pixel-7a-io-2023/

  • Écran de 6 pouces
  • Triple appareil photo (grand angle, principal, et photo avant pour les selfies)
  • 509 euros
  • Magic Eraser pour effacer les trucs qu’on ne veut pas dans la photo, Magic Unblur pour rendre une photo floue plus nette, Real Tone pour rendre les peaux foncées plus naturelles

Android

Article quoi de neuf dans Android : https://blog.google/products/android/android-updates-io-2023/

Google Maps

Article : https://blog.google/products/maps/google-maps-updates-io-2023/

  • Maps propose 20 milliards de km de direction tous les jours
  • Immersive View for Routes
  • 15 villes : Amsterdam, Berlin, Dublin, Florence, Las Vegas, London, Los Angeles, Miami, New York, Paris, San Francisco, San Jose, Seattle, Tokyo et Venice
  • Possibilité pour les développeurs de s’intégrer et rajouter des augmentations 3D, des marqueurs

Google Photos

Article Magic Editor : https://blog.google/products/photos/google-photos-magic-editor-pixel-io-2023/

  • Magic Editor survitaminé à l’IA pour améliorer les photos, en déplaçant des gens, en rajoutant des parties coupées, ou bien rendre le ciel plus beau
  • Possible que ce soit limité aux téléphones Pixel au début

Projets expérimentaux

Search Labs

Article : https://blog.google/products/search/generative-ai-search/

  • Expérimentations pour rajouter l’IA générative dans Google Search
  • Faire des recherches avec des requêtes avec des phrases plus complexes, en intégrant des réponses comme Bard, avec des liens, des suggestions d’autres recherches associées
  • Mais aussi proposer des publicités mieux ciblées
  • On peut s’inscrire à Search Labs pour tester cette nouvelle expérience, mais au début juste en anglais et juste pour les US
  • Des intégrations avec Google Shopping pour proposer et filtrer des produits qui correspondent à la requête
  • Recherche à l’aide d’image, avec Google Lens : 12 milliards de recherches visuelles par mois

Palm et Bard

  • Annonce du modèle LLM Palm 2 utilisé dans Bard et dans Google Cloud https://blog.google/technology/ai/google-palm-2-ai-large-language-model/
  • PaLM 2 est en cours d’intégration dans 25 produits de Google
  • Supportera 100 langues différentes (pour l’instant seulement l’anglais, japonais et coréen), avec déjà les 40 langues les plus parlées d’ici à la fin de l’année
  • Maintenant disponible dans 180 pays… sauf l’Europe !!!
  • Capacité de raisonnement accrue
  • Peut coder dans une vingtaine de langages de programmation différents dont Groovy
  • Différentes tailles de modèles : Gecko, Otter, Bison et Unicorn, mais le nombre de paramètres n’est pas communiquée, comme pour GPT-4 d’OpenAI
  • Utilisable pour des requêtes et pour du chat
  • Des modèles dérivées fine-tunés Med-PaLM 2 sur du savoir médical, sur l’analyse visuelle des radios et Sec-PaLM, entrainé sur des cas d’utilisation sur le thème de la cybersécurité, pour aider à déceler des scripts malicieux, des vecteurs d’attaque
  • Sundar Pichai a aussi annoncé que Google travaillait déjà sur la prochaine évolution de ses LLM avec un modèle appelé Gemini. Peu de détails à part qu’il sera multimodal (en particulier recherche combinée image et texte par ex.)
  • Partenariat et intégration d’Adobe Firefly dans Bard pour générer des images https://blog.adobe.com/en/publish/2023/05/10/adobe-firefly-adobe-express-google-bard

Duet AI pour Google Workspace

Article : https://workspace.google.com/blog/product-announcements/duet-ai

  • Dans Gmails et Docs, propose d’aider à la rédaction de vos emails et documents
    • une extension de “smart compose” qui va permettre de générer des emails entiers, d’améliorer le style, de corriger la grammaire, éviter les répétitions de texte
  • Dans Docs, des nouveaux “smart chips” pour rajouter des variables, des templates
  • Dans Slides, rajouter des images générées par IA
  • Des prompts dans Sheets pour générer un draft de table
  • Dans Google Meet, possibilité de créer une image de fond customisée avec Generative AI
  • Ces améliorations font parties de Workspace Labs auquel on peut s’inscrire dans la liste d’attente https://workspace.google.com/labs-sign-up/

Google Cloud

Intégration de Generative AI partout https://cloud.google.com/blog/products/ai-machine-learning/google-cloud-launches-new-ai-models-opens-generative-ai-studio

  • Nouvelles VM A3 avec les GPUs H100 de Nvidia, idéal pour l’entrainement de modèles de machine learning, avec 26 exaFlops de performance https://cloud.google.com/blog/products/compute/introducing-a3-supercomputers-with-nvidia-h100-gpus
  • Trois nouveaux modèles LLM dans Vertex AI : Imagen (private preview) pour générer des images, Codey pour la génération de code, et Chirp pour la génération de la parole supportant 100 langues différentes avec 2 milliards de paramètres vocaux
  • Model Garden : avec les modèles de machine learning y compris externes et open sources
  • Ajout des embeddings pour le texte et l’image
  • RLHF, Reinforcement Learning from Human Feedback bientôt intégrer pour étendre Vertex AI tuning et prompt design avec une boucle de feedback humaine
  • Generative AI Studio pour tester ses prompts zero-shot, one-shot, multi-shots
  • Duet AI pour Google Cloud https://cloud.google.com/blog/products/application-modernization/introducing-duet-ai-for-google-cloud
  • Assistance de code dans VSCode et bientôt les IDEs JetBrains grâce au plugin Cloud Code, et dans Cloud Workstations.
  • Intégration dans les IDEs d’un chat pour comme un compagnon pour discuter d’architecture, trouver les commandes à lancer pour son projet
  • Le modèle de code de Codey fonctionne sur une vingtaine de languages de programmation, mais un modèle fine-tuné a été entrainé sur toute la doc de Google Cloud, donc pourra aider en particulier sur l’utilisation des APIs de Google Cloud, ou l’utilisation de la ligne de commande gcloud
  • Duet AI est aussi dans App Sheet, la plateforme low/no-code, et permettra de chatter avec un chatbot pour générer une application App Sheet
  • Quoi de neuf dans Firebase https://firebase.blog/posts/2023/05/whats-new-at-google-io

Web

Article : https://developers.googleblog.com/2023/05/io23-developer-keynote-recap.html

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 295 - La librairie rentre dans le cadre

Posté le 15/05/2023

Dans cet épisode, Arnaud, Antonio et Emmanuel décortiquent les nouvelles d’avril et mai. On y discute Java 20, écrire un profiler de zéro, Quarkus 3 (encore !), Micronaut 4, Podman, JReleaser, GitHub, CloudEvent, GraphQL, licenciements (encore !), et de la question a 1000 francs : librairie vs framework, quelle différence ? Mais pas que.

Enregistré le 12 mai 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-295.mp3

News

Langages

Un descriptif du changement de tarification d’Oracle JDK https://horstmann.com/unblog/2023-02-23/

  • Article de Cay S. Horstmann.
  • Explique OpenJDK avec plusieurs distributeurs.
  • Préfère Adoptium, dont celle par défaut est Eclipse Temurin.
  • Pour Oracle, beaucoup d’options de licenses (no-fee, binary code, OTM license).
  • Oracle dépense beaucoup pour Java.
  • La license en discussion est Java SE Universal Subscription Licensing.
  • Passage de license par CPU (Java SE advanced) vers license par employé (et une assiette large).
  • Bref si vous êtes concernés, passez sur OpenJDK : Adoptium, ou d’autres vendeurs.

Java 20 est sorti : qu’y a-t-il de nouveau dans Java 20 par rapport à Java 19 ? https://foojay.io/today/its-java-20-release-day-heres-whats-new/

  • L’article fait le point sur ce qu’il y a de nouveau par rapport à la précédente release :
    • 4ème preview du pattern matching pour switch,
    • 2de preview des record patterns,
    • 2de preview des virtual threads,
    • incubation des scoped values (similaire au thread locals mais pour les virtual threads),
    • 2de incubation de la structured concurrency,
    • 2de preview de foreign function et memory API,
    • 5ème incubation de la vector API (pour utiliser les instructions vectorielles des processeurs).
  • La liste des JEPs : https://openjdk.org/projects/jdk/20/.
  • Les release notes : https://jdk.java.net/20/release-notes.
  • Dans le pattern matching switch: guard when .
  • Record pattern : var maintenant aussi utilisable dans les for : for (Delay(var timeInMS) : delays)
  • Quelques changements autour de l’API Thread en non preview (main API).
  • Les ScopedValues sont comme les ThreadLocals par (virtual) thread, mais elles sont immuables une fois écrites.
  • Use cases : copie d’état pour des données non changeantes pour le virtual thread.
  • Serait intéressant d’avoir des details dessus.

PDF 2.0 maintenant un vrai format ISO ouvert et gratuit https://www.pdfa.org/sponsored-standards/

  • Standard disponible sans coût.
  • Versions précédentes étaient payantes.
  • Clarifications et corrections de beaucoup de cas aux limites.

Librairies

Écrire un Profiler en 240 lignes de Java https://mostlynerdless.de/blog/2023/03/27/writing-a-profiler-in-240-lines-of-pure-java/

  • Ce n’est peut-être pas si compliqué d’écrire soi-même un Java Profiler ! Et justement cet article nous montre comment le faire, en créant un Java Agent, en analysant les stacks d’appel, et à la fin en créant même un flame graph en HTML.
  • Très didactique !
  • Fondamentalement : appeler Threads:getAlStackStrace régulièrement, faire une liste des méthodes visibles et créer un flamegraph à partir de ces données.

L’équipe de Flutter partage les grands thèmes de sa roadmap https://flutter.dev/go/strategy-2023

  • Performance, interopérabilité, portabilité, écosystème, sécurité, fondamentaux (comme la documentation, la fidélité des UI natives, adresser les issues publiques).

Quarkus 3 est sorti https://quarkus.io/quarkus3/

  • On a déjà couvert.
  • Hibernate ORM 6.2.
  • Nouvelle DevUI et admin sur un port different.
  • Support for Pact.
  • quarkus deploy et extensibilité de la CLI avec de nouveaux verbes.
  • Dev Services for Kubernetes simule un Kube pour tester les calls vers l’API Kube.
  • Java 11 et 17 (recommandé).
  • Jakarta EE.
  • Eclipse MicroProfile 6.

Une librairie en Java spécialement pour l’astronomie par Cédric Champeau https://melix.github.io/blog//2023/04-22-introducing-astro4j.html

  • Différentes librairies et applications pour traiter les images issues de Sol’Ex.
  • Sol’Ex permet de prendre des photos du soleil.

Micronaut 4 milestone 2 est sorti. Les nouveautés de Micronaut 4 https://docs.micronaut.io/4.0.0-M2/guide/index.html#whatsNew

  • Kotlin 1.8.0.
  • Experimental Support for Kotlin Symbol Processing (KSP).
  • Apache Groovy 4.0.
  • Core Changes :
    • Java 17 Baseline,
    • Improved Modularity,
    • GraalVM Metadata Repository and Runtime Initialization,
    • Completed javax to jakarta Migration,
    • Expression Language,
    • Injection of Maps,
    • Arbitrary Nesting of Configuration Properties,
    • Improved Error Messages for Missing Configuration,
    • Improved Error Messages for Missing Beans,
    • Tracking of Disabled Beans.
  • HTTP Changes :
    • Initial Support for Virtual Threads (Loom),
    • Rewritten HTTP layer,
    • Annotation-Based HTTP Filters,
    • JDK HTTP Client.

Infrastructure

5 choses à savoir sur Podman Desktop pour un utilisateur Docker https://podman-desktop.io/blog/5-things-to-know-for-a-docker-user

  • Une UI unique pour travailler avec différents moteurs de conteneurs, et pas uniquement Docker.
  • Compatible avec Docker avec un mode adapté pour fonctionner aussi avec la docker CLI ou docker.sock pour les sockets.
  • Support de Compose.
  • Support de Kubernetes.
  • Sécurité : on peut utiliser rootless sans avoir les privilèges root.
  • Socket est particulièrement utile pour TestContainer.
  • compose n’est pas supporté en tant que tel, mais on peut faire utiliser podman par compose.
  • Podman peut émuler / exécuter des definitions de pods.
  • Si besoin d’exposer des ports <1024, on peut activer le mode root.

Keycloak rejoins la CNCF [https://www.tfir.io/keycloak-cloud-native-iam-for-cloud-native-applications-joins-the-cncf/)

  • IAM complete au sein de la CNCF.
  • Keycloak sur base Quarkus : “cloud natif”.

Cloud

Un court article de chez Baeldung qui liste des distributions Kubernetes légères et partage leurs avantages et inconvénients respectifs https://www.baeldung.com/ops/kubernetes-lightweight-distributions

  • Minikube (que des clusters à nœud unique),
  • MicroK8S (à jour avec les releases Kubernetes, mais pas de support des CPUs ARM32),
  • Kind (conteneurs considérés comme des nœuds, plus difficile à configurer avec autre chose que Docker),
  • K3S (moins de consommation de resources).

Google I/O 2023 : la liste des 100 trucs annoncés https://blog.google/technology/developers/google-io-2023-100-announcements/

  • Bard, le concurrent de ChatGPT, disponible dans 180 pays… sauf les pays européens.
  • Pixel 7a, Pixel Tablet et Pixel Fold.
  • Plein d’annonces autour de l’AI avec l’API PaLM (utilisée dans Bard), plein de Generative AI de partout dans les produits (search, workspace,..), y compris un modèle de code (qui comprend même le Groovy) qui va être intégré aux IDE, VSCode, etc.

Outillage

Connaissiez-vous le flag --json de curl ? https://glaforge.dev/posts/2023/03/22/curl-s-json-flag/

  • Ça simplifie les interactions avec les APIs qui utilisent du JSON.
  • Plus besoin de passer les headers de Content-Type et d’Accept, c’est moins verbeux.
  • Rajouté il y a un an dans curl 7.82 (pour info, sur mon mac, par exemple, je suis en 7.86).
  • curl --json '{ "drink": "coffe" }' https://example.com ou curl --json @prepared https://example.com pour pointer vers un fichier.

Rétropédalage chez Docker https://www.docker.com/blog/no-longer-sunsetting-the-free-team-plan/

Github supprime le sponsoring par Paypal… et plein de développeurs Open Source perdent leurs sponsorships https://github.com/orgs/community/discussions/45183

Github a mis à jour sa clé RSA SSH Host https://github.blog/2023-03-23-we-updated-our-rsa-ssh-host-key/

  • Apparemment, ils ont commité brièvement leur clé privée, oops !
  • Potentielle disruption pour certains, avec impossibilité de committer son code.
  • Il faut alors “oublier” l’ancienne clé publique et mémoriser la nouvelle.
  • Personnellement, j’ai commité du code à partir de Visual Studio Code et je n’ai pas eu de soucis.
  • Que sur RSA et pas sur les clés à courbe elliptique.
  • Clé privée aurait pu faire du spoofing ou du déchiffrement de flux en SSH via RSA vers GitHub.

2ème anniversaire de JReleaser https://andresalmiray.com/jreleasers-second-birthday/

  • JReleaser permet de publier sur plusieurs appstores (Homebrew, JBang, etc).
  • Publie sur maven central automatiquement.
  • Publie les annonces sur Twitter, Zulip…
  • Publication de binaires (GitHub…) et de changelogs.

Architecture

Introduction à CloudEvents https://atamel.dev/posts/2023/04-03_cloudevents_basics/

  • Décrire des évènements de données de manière commune.
  • Métadonnées standardisées pour le routage
  • En JSON ou en cloudevents+json.
  • Métadonnées incluent : id, source, type, sujet, time, type de contenu de donnée, schema de données et des extensions comme partitioning…
  • Binary mode : données dans le corps du message, et métadonnées en header. Efficace pour parsing minimal.
  • Structured-mode : données et métadonnées dans la même enveloppe.
  • Batch-mode : plusieurs évènements en un seul envoi.
  • Formats : JSON, protobuf, Avro et XML.
  • Protocoles : HTTP, AMQP, Kafka, MQTT, NATS, WebSocket.
  • Des évolutions futures planifiées.

GraphQL, tout n’est pas si rose https://betterprogramming.pub/graphql-from-excitement-to-deception-f81f7c95b7cf

  • Pour Facebook qui pense en tant que graphe de données.
  • Pour leur application mobile qui devait être à bande passante limitée.
  • Choses positives : une requête pour plusieurs resources, sélection des données dont on a besoin uniquement, typé (entre client et serveur), meilleur outillage dev pour l’exploration, pas de soucis de version d’API ?
  • Équipe qui embrace GraphQL en 2019.
  • Les perfs optimisées par un choix de données ne se sont pas matérialisées pour eux (sauf mobile, donc pas machine-machine ou machine-desktop).
  • La latence de REST reste mieux que GraphQL.
  • En pratique desktop et mobile sont assez similaires en données fetchées.
  • Schémas apportaient des problèmes en pratique ; synchro front et back, code first generation avait des problèmes de qualité du code généré.
  • Schema → code est meilleur, mais synchro front back toujours un problème en pratique.
  • Erreurs, plus simple en rest avec les codes HTTP a debugger et monitorer.
  • Version free est un mensonge, les schemas ne peuvent être cassés.
  • La pagination est compliquée et non standard. Caching primitif comparé à REST.
  • N+1 problem comme dans les ORMs ou alors dataloaders qui amène de la complexité.
  • La sécurité est plus compliquée à cause de la navigation libre de GraphQL.
  • Écosystème pas encore super mature pour les besoins et paradoxalement très complexe.

Méthodologies

Trends technologie et culture par InfoQ https://www.infoq.com/articles/culture-trends-2023/

  • Les licenciements ont cassé les effets de psychological safety dans l’industrie.
  • Les IA génératives ont un impact fort sur la productivité du développeur, mais aussi avec des faiblesses significatives.
  • Au-delà du légal, les responsabilités sociétales deviennent plus importantes pour retenir employés et clients.
  • Le travail asynchrone devient plus accepté socialement, et adopter les pratiques apporte des bénéfices réels.
  • Le travail hybride devient la norme, amener les gens ensemble devient un choix délibéré, plus un horaire fixe.

Loi, société et organisation

Red Hat fête ses 30 ans ! (limite, on n’était même pas nés, hein ?) https://www.redhat.com/en/blog/red-hat-30th-anniversary-celebrating-red-hat-day-north-carolina

Red Hat licencie 4% de ses employés https://wraltechwire.com/2023/04/24/red-hat-cutting-hundreds-of-jobs-ceo-says-in-letter-to-employees/

  • IBM avait annoncé 3900 licenciements il y a peu et cela monte à 5000 avec les licenciements chez Redhat (les effectifs étaient de 2200 à Raleigh et 19000 à l’international).
  • Licenciements suite au contexte économique post-Covid, les revenus trimestriels de Red Hat n’ont été que de 8% en Q1 alors que la croissance était de 15 depuis l’acquisition de Red Hat par IBM en 2019.

Crazy Bob est décédé 😭 https://www.sfgate.com/bayarea/article/mill-valley-man-killed-sf-stabbing-17878809.php

10 millions de comptes sur Mastodon https://mastodon.social/@mastodonusercount/110051957865629817

  • Peut-être pas 10 millions de comptes actifs, mais d’autres commentateurs estiment le nombre d’actifs serait plutôt de 6 à 7 millions actifs, pour effectivement 10 millions de comptes créés donc certains inutilisés ou disparus (serveur disparu).

Gordon Moore meurt à 94 ans https://www.lemonde.fr/economie/article/2023/03/26/mort-de-gordon-moore-entrepreneur-par-accident-et-cofondateur-d-intel_6167037_3234.html

  • Chimiste de formation, il refuse de bosser autour de la bombe atomique et fini dans la silicon valley.
  • Fonde un des premiers semi-conducteurs (plusieurs transistors ensembles).
  • Intel sera un des premiers à parier sur le silicium (pour construire de la mémoire) et un des premiers à faire une puce intégrée regroupant plusieurs fonctions.

Twitter open source ses algorithmes de recommendation https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm

  • On retrouve le code source sur Github https://github.com/twitter/the-algorithm-ml.
  • Et quelqu’un a déjà trouvé où il y a des clauses particulières pour le cas où un tweet vient d’Elon Musk, où un tweet vient d’un républicain ou d’un démocrate : https://uwyn.net/@danluu@mastodon.social/110119479811452246.
  • L’algorithme de Twitter https://aakashgupta.substack.com/p/the-real-twitter-files-the-algorithm.
  • Analyse sans sensation.
  • Trois étapes : aggravation des données, construction des “features”, mixage.
  • Followers, nos tweets et nous.
  • Plus gros booster likes 30x, puis retweet 20x.
  • Feature : SimCluster : groupe par categories/personnes le tweet.
  • Feature : TwHIN : vecteur de prediction d’engagement pour un tweet donné.
  • Feature : RealGraph : prend le tweet, le tweeter et le tweeté et construit un graphe pondéré de potentiel d’interaction.
  • Règles de confiance et sécurité : élimine certains sujets (cela censure plus depuis Elon Musk)
  • Mixer : prend tout et construit la “timeline”.
  • Utilisateur répond aux réponses : x75.
  • En fait que 80% du code ouvert.

The end of faking it in silicon valley https://www.nytimes.com/2023/04/15/business/silicon-valley-fraud.html

  • Les startups qui brulaient du cash sans business model clair.
  • Procès et prisons pour falsification de données clients.
  • Les approches non éthiques ne sont plus ignorées.
  • Avant les investisseurs avaient peur de se mettre les créateurs de boite à dos, maintenant, l’argent vaut cher.
  • “finding out who is swimming naked when the tide goes out” Warren Buffett.
  • “It feels like we were in a nightclub and the lights just turned on”.
  • Ils vont évaluer plus exhaustivement les fondateurs.
  • Le problème, c’est que VC c’est sur la confiance (one-way au moins) et que là, c’est cassé.

Rubrique débutant

On parle souvent de librairies et de frameworks, mais c’est quoi la différence ? https://www.red-gate.com/simple-talk/development/other-development/the-difference-between-libraries-and-frameworks/

  • Une librairie est une collection de classes, de fonctions, de code, que l’on peut utiliser pour des tâches spécifiques, pour éviter au développeur de réinventer la roue (par exemple une librairie comme Joda Time qui permet de simplifier / codifier la représentation du temps).
  • Il y a différents types de librairies : des librairies statiques ou dynamiques, suivant qu’elles sont chargées au runtime ou bien attachées au code que l’on compile. Il y a des librairies standards (comme celles venant du JDK et donc inclues avec lui) ou des librairies tierces (que l’on va par exemple trouver sur Maven Central).
  • Un framework (un “cadriciel” en bon français) c’est aussi un ensemble de code, mais aussi de librairies, qui va offrir un cadre de développement pour ses applications.
  • Par exemple un framework Web qui permet de créer des applications Web plus facilement, ou Tensorflow pour développer de nouveaux algorithmes d’intelligence artificielle, ou Unity pour développer des jeux vidéos.
  • Mais un framework est effectivement plus “cadrant” dans le sens où on doit suivre ses recommendations sur comment structurer son code, comment étendre des classes ou interfaces du framework, etc.
  • Ainsi que les bonnes pratiques et parfois une boite à outil “prêt à l’emploi” vs assemblage.
  • Article qui décrit les pour et les contre.

Conférences

Une liste de conférences Java https://javaconferences.org/

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 294 - A Devoxx France 2023 en chair en os et en béret

Posté le 17/04/2023

Les Cast Codeurs font la clôture de Devoxx France 2022 en chair, en os et en béret.

Enregistré le 14 avril 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-294.mp3

Interview

La vidéo du direct Devoxx France qui est plus facile à suivre se trouvera sur YouTube.

Nous contacter

Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Faire un crowdcast ou une crowdquestion
Contactez-nous via twitter https://twitter.com/lescastcodeurs
sur le groupe Google https://groups.google.com/group/lescastcodeurs
ou sur le site web https://lescastcodeurs.com/


LCC 293 - Interview Maven et builds reproductibles avec Hervé Boutemy

Posté le 06/04/2023

Dans le cocon de JChateau, Hervé Boutemy se fait interviewer par Charles Sabourdin sur Maven 3, 4, 5 et sur les builds reproductibles. Un grand merci à Charles pour son passage derrière le micro.

Enregistré le 18 mars 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-293.mp3

Interview

Twitter Hervé Boutemy

JChateau
JavaDay

Maven et son histoire

Les builds reproductibles
Les builds reproductibles sur la JVM
Les builds reproductibles avec Maven

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 292 - Enterprise Go Beans

Posté le 20/03/2023

Cet épisode nouvelles discute d’améliorations dans le JDK, d’Hibernate 6, de Service Weaver, de la fin d’options dans DockerHub pour certains projets open source, de Gradle, de cURL et pleins d’autres choses encore.

Enregistré le 17 mars 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-292.mp3

News

Langages

Quelle version de JDK utiliser en fonction des fonctionnalités que l’on souhaite utiliser, mais aussi du long time support ? https://whichjdk.com/

JetBrains propose une formation Rust intégrée aux IDEs https://blog.jetbrains.com/rust/2023/02/21/learn-rust-with-jetbrains-ides/

  • Un apprentissage directement intégré à l’IDE.
  • Avec un plugin “Academy” dédié, qui rajoute un troisième panneau avec les instructions, les explications, et on fait des exercices dans la partie IDE.
  • Une chouette manière d’apprendre intégrée directement à son IDE.
  • Chacun doit pouvoir créer ses propres ressources d’apprentissage, et on pourrait appliquer ça à des frameworks, des outils, ou pourquoi pas son propre projet informatique !

Retravail de classes du JDK Bits / ByteArray vers un usage via VarHandle pour le swapping de bits dans Java 21 https://minborgsjavapot.blogspot.com/2023/01/java-21-performance-improvements.html

  • Petit changement, mais utilisé par beaucoup de classes comme ObjectInputStream ou RandomAccessFile.
  • Améliore la sérialisation en Java.

Rajout de la notion de sequenced collection dans la hiérarchie des collections, planifié pour le JDK 21 https://www.infoq.com/news/2023/03/collections-framework-makeover/

  • Va permettre de codifier les collections qui ont un ordre donné (pas forcément trié).
  • Rajoute aussi des méthodes pour traverser des collections séquentielles à l’envers, ou pour récupérer ou ajouter un élément au début ou à la fin d’une collection ordonnée.
  • Aujourd’hui, ces méthodes sont éparpillées dans les implémentations et n’avaient pas de contrat commun.

Le guide ultime des virtual threads https://blog.rockthejvm.com/ultimate-guide-to-java-virtual-threads/

  • Un très long article qui couvre le sujet des nouveaux virtual threads.
  • Comment en créer ?
  • Comment ils fonctionnent ?
  • Le scheduler et le scheduling coopératif.
  • Les “pinned” virtual threads (lorsqu’un thread virtuel est bloqué dans un vrai thread, par exemple dans un bloc synchronized ou lors d’appels de méthodes natives).
  • Les thread local et thread pools.

Librairies

Quarkus 3 alpha 5 avec Hibernate ORM 6 et une nouvelle DevUI https://quarkus.io/blog/quarkus-3-0-0-alpha5-released/

La route vers Quarkus 3, article sur InfoQ https://www.infoq.com/news/2023/03/road-quarkus-3/

  • Jakarta EE, ORM 6, Microprofile 6, virtual threads, io_uring, ReactiveStreams => Flow.
  • io_uring réduit les copies de buffer entre user space et kernel space.
  • Pas de support JPMS en vue, mais Red Hat contribue au projet Leyden.
  • Camel extensions : attendez Camel 4 (passage Jakarta EE).

Interview de Geert Bevin, l’auteur du framework Java RIFE2 https://devm.io/java/rife2-java-framework

Google annonce Service Weaver https://opensource.googleblog.com/2023/03/introducing-service-weaver-framework-for-writing-distributed-applications.html

  • EJB is back (Enterprise Go Beans :D) !
  • Écrire en tant que modular monolith.
  • Permet au déploiement de décider ce qui est distribué ou non.
  • Basé sur leur expérience du surcoût de maintenance des microservices (contrats plus difficiles à casser, besoin de coordination de rollout…)
  • Dans la communauté des enthousiastes.
  • Et des gens concernés par les 10 fallacies of distributed computing et le fait de cacher les appels distants.
  • Avant cela, EJB et CORBA ont été des échecs de ce point de vue-là.
  • Ils n’expliquent pas comment le binding de nouveaux contrats et de déploiement se fait de manière transparente.
  • Des déployeurs implémentables (go et GKE initialement).

Étude d’opinion de certains utilisateurs de Jakarta EE (OmniFaces community) https://omnifish.ee/2023/03/10/jakarta-ee-survey-2022-2023-results/

  • Biaisée, donc attention.
  • Java EE 8, suivi par Jakarta EE 8 et derrière Jakarta EE 10 etc.
  • WildFly, puis Payara, puis GlassFish, ensuite Apache TomEE et JBoss EAP.
  • Gens contents de leurs serveurs d’application sans WebLogic et Websphere.
  • Les API utilisées le plus : JPA, CDI, REST, Faces, Servlet, Bean Validation, JTA, EJB, EL…
  • Produit MicroProfile : Quarkus, puis WildFly, puis Open Liberty, puis Payara et Helidon.
  • Les plus utilisés dans MicroProfile : Config, REST client, Open API, health et metric.

Comment utiliser des records et Hibernate https://thorben-janssen.com/java-records-embeddables-hibernate/

  • Pas en tant qu’entité encore (car final et pas de constructeur vide).
  • Mais en tant qu’@Embeddable.
  • Les records sont immuables.
  • Dans Hibernate 6.2, c’est supporté par défaut (annoter le record avec @Embeddable).
  • Ça utilise le contrat EmbeddableInstantiator.

Cinq librairies Java super confortables https://tomaszs2.medium.com/5-amazingly-comfortable-java-libraries-887802e240de

  • MapStruct : pour mapper des entités en DTO.
  • jOOQ : pour des requêtes de bases de données typées.
  • WireMock : pour mocker des API ou être entre le client et l’API pour ne mocker que certaines requêtes.
  • Eclipse Collections : pour rendre le code plus simple et facile à comprendre. Attention à la surface d’attaque.
  • HikariCP : connection pool rapide. Agroal est dans la même veine, mais supporte JTA (c’est ce qui est utilisé dans Quarkus).

Retour d’expérience sur Hibernate 6 https://www.jpa-buddy.com/blog/hibernate6-whats-new-and-why-its-important/

  • Côté API et côté moteur.
  • Jakarta Persistence 3 et java 11.
  • Les annotations de types hibernate sont typesafe.
  • Support des types JSON out of the box.
  • Meilleur support des dates avec @TimeZoneStorage, soit natif de la base, soit avec une colonne séparée.
  • Changement dans la génération des ID (changement cassant), mais la stratégie de nommage historique peut être activée.
  • Options autour de UUID (time-based et IP-based).
  • Les composite IDs n’ont plus besoin d’être sérialisable.
  • Type texte long supportés via @JdbcTypeCode.
  • Multi-tenancy (shared schema, resolver de tenant à plugger).
  • Read by position (SQL plus court car sans alias, désérialisation plus rapide, moins de JOIN dans certains cas).
  • Modèle sous-jacent commun entre HQL et l’API criteria, et donc même moteur.
  • Meilleure génération du SQL et plus de fonction SQL modernes réduisant le gap entre HQL et SQL.
  • Fonctions analytiques et fenêtre quand la base les supportent.
  • Graphe traversé en largeur plutôt qu’en profondeur (potentiellement plus de JOIN donc bien mettre lazy sur vos associations).

Cloud

Docker supprime les organisations open source sur DockerHub https://blog.alexellis.io/docker-is-deleting-open-source-images/

Web

Une base de connaissance sur le fonctionnement et les bonnes pratiques autour des WebHooks https://nordicapis.com/exploring-webooks-fyi-the-webhooks-knowledge-center/

Guillaume a refondu son blog https://glaforge.dev/

  • Cette fois-ci, c’est un site web statique, généré avec Hugo, avec des articles en Markdown, hébergé sur Github Pages, construit / publié automatiquement par Github Actions.

Outillage

Gradle 8.0 est sorti https://docs.gradle.org/8.0/release-notes.html

Une CLI connectée à OpenAI’s Davinci model pour générer vos lignes de commandes https://github.com/TheR1D/shell_gpt

  • sgpt -se "start nginx using docker, forward 443 and 80 port, mount current folder with index.html"
  • -> docker run -d -p 443:443 -p 80:80 -v $(pwd):/usr/share/nginx/html nginx
  • -> Execute shell command? [y/N]: y

Un petit outil en ligne basé sur le modèle GPT-3 qui permet d’expliquer un bout de code https://whatdoesthiscodedo.com/g/db97d13

  • Copiez-collez un bout de code de moins de 1000 caractères et l’outil vous explique ce qu’il fait.
  • Assez impressionnant, quand on pense que c’est un modèle de prédiction probabiliste des prochains caractères logiques.
  • Certaines réponses donnent parfois vraiment l’impression que l’outil comprend réellement l’intention du développeur derrière ce bout de code.

Git: Comment rebaser des branches en cascade https://adamj.eu/tech/2022/10/15/how-to-rebase-stacked-git-branches/

native-image va être inclus dans la prochaine version de GraalVM JDK. Plus besoin de gu install native-image https://github.com/oracle/graal/pull/5995

Si vous utilisez l’outil Mermaid pour faire des graphes d’architecture, d’interactions, etc, il y a un petit cheatsheet sympa qui montre comment faire certains diagrammes https://jojozhuang.github.io/tutorial/mermaid-cheat-sheet/

Un site avec plein de trucs et astuces sur psql, la CLI de PostgreSQL https://psql-tips.org/

cURL a 25 ans ! https://daniel.haxx.se/blog/2023/03/10/curl-25-years-online-celebration/

  • Son créateur, Daniel Stenberg, est toujours à la tête du projet.
  • cURL est utilisé dans d’innombrables projets.
  • Par défaut dans de nombreux systèmes d’exploitation.

Cédric Champeau explique le concept de version catalog de Gradle et comment il améliore la productivité https://melix.github.io/blog//2023/03-12-micronaut-catalogs.html

  • Permet de réduire le temps et l’effort nécessaire à gérer la version de ses dépendances.
  • Apporte aussi plus de sécurité et de flexibilité, pour s’assurer qu’on a les bonnes versions les plus récentes des dépendances et qu’elles fonctionnent bien entre elles.

Architecture

La pyramide des besoins du code de qualité https://www.fabianzeindl.com/posts/the-codequality-pyramid

  • Le bas de la pyramide supporte le haut.
  • Les blocs :
    • performance de build,
    • performance de test,
    • testabilité,
    • qualité des codes de composants,
    • fonctionnalités,
    • performance du code.
  • Pour chaque bloc, il explique les raisons, ses definitions et des astuces pour l’améliorer.
  • Par exemples, les fonctionnalités changent et donc build, testabilité et qualité de code permettent des changements légers en cas de changement dans les fonctionnalités.
  • Les perfs viennent ensuite (premature optimization is the root of all evil), regarder les besoins globaux.

Méthodologies

Le DevSusOps est né https://www.infoq.com/news/2023/02/sustainability-develop-operation/

Sécurité

Plein de choses qu’on peut faire avec des YubiKeys https://debugging.works/blog/yubikey-cheatsheet/

  • pour générer des time-based one-time passwords,
  • pour l’accès SSH,
  • pour sécuriser une base Keepass,
  • comme 2FA pour le chiffrement de disque,
  • pour la vérification d’identifiants personnels,
  • pour gérer les clés privées,

Loi, société et organisation

Le fabricant de graveurs de CPU hollandais ASML se voit interdire d’exporter ses technologies vers la Chine https://www-lemagit-fr.cdn.ampproject.org/c/s/www.lemagit.fr/actualites/365532284/Processeurs[…]le-escalade-dans-les-sanctions-contre-la-Chine?amp=1

  • En tout cas, les technologies de gravure des deux dernières générations.
  • De la pression commerciale, on passe au registre d’exclusion par décision militaire.
  • ASML s’était fait espionner récemment.
  • Canon et Sony aussi dans la restriction.

Meta supprime de nouveau 10000 emplois soit 25% au total depuis la fin de l’année dernière https://www.lesechos.fr/tech-medias/hightech/meta-va-supprimer-10000-postes-de-plus-1915528

Rubrique débutant

Bouger les éléments d’une liste https://www.baeldung.com/java-arraylist-move-items

  • Discute du concept d’ArrayList en-dessous, et donc le coût d’insérer au milieu.
  • Découverte de Collections.swap, pour intervertir deux éléments.
  • Découverte de Collections.rotate, pour “déplacer” l’index zero de la liste.

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/