Data Engineering
про инжиниринг данных и аналитику
🏢 %company% Engineering
AirBnb Engineering
последний пост 4 days, 8 hours назад
Privacy-first connections: Empowering social experiences at Airbnb
Privacy-first connections: Empowering social experiences at Airbnb Privacy-first connections: Empowering social experiences at Airbnb

Discover how Airbnb prioritizes user privacy while building a more connected community, empowering guests to engage socially, connect confidently, and maintain control of their personal data.By: Joy Jing✨ Building a more connected communityAt Airbnb, our hosts and guests form the heart of our community. As shared by CEO Brian Chesky, we’re evolving into a more social ecosystem. Airbnb Experiences now highlight the people involved as much as the activity. Guests can see Who’s going on an Experience, message co-guests directly, and view people they’ve met through the Connections section in their Airbnb profile. Guests are able to choose to share their profile for each new Experience. Guests w…

4 days, 8 hours назад @ medium.com
Building a high-volume metrics pipeline with OpenTelemetry and vmagent
Building a high-volume metrics pipeline with OpenTelemetry and vmagent Building a high-volume metrics pipeline with OpenTelemetry and vmagent

A production-tested approach for moving a large-scale metrics pipeline from StatsD to OpenTelemetry and Prometheus.By: Eugene Ma, Natasha AleksandrovaWhen migrating to a new monitoring system, you’ll want to frontload the work to collect all your metrics. This exposes bottlenecks at full write scale and unblocks the migration of assets which require real data for validation, such as dashboards and alerts. Collecting all your metrics first means you can focus on major technical challenges — scale, correctness and performance — without worrying about how users will adopt your new tools.But for our project, this approach wasn’t straightforward: most of our metrics were instrumented with StatsD…

1 week, 4 days назад @ medium.com
My Journey to Airbnb — Jonathan Woodard
My Journey to Airbnb — Jonathan Woodard My Journey to Airbnb — Jonathan Woodard

Jonathan Woodard knows defense. After playing professional football as a defensive end for six years, Jonathan knew he wanted a career where he could always face new challenges, learn new skills, and continue to thrive in high-paced environments. After discovering a passion for programming, Jonathan joined Airbnb’s Connect Engineering Apprenticeship program and excelled; now, we’re lucky to have him on our secure development engineering team. Here’s his story.Joining the big leaguesLike many kids, I wanted to grow up to become a professional athlete. Playing professional football was my dream, but over the years, it faded into the background because it seemed unrealistic — until it wasn’t.I…

2 weeks, 2 days назад @ medium.com
What COVID did to our forecasting models (and what we built to handle the next shock)
What COVID did to our forecasting models (and what we built to handle the next shock) What COVID did to our forecasting models (and what we built to handle the next shock)

How Airbnb built forecasting models resilient enough to survive a global pandemic and whatever shock comes next.By: Harrison KatzThe week everything brokeIn March 2020, the forecasting models that had served us well in stable times faced a new challenge: predicting outcomes in a world that had suddenly changed.At Airbnb, many of the financial metrics we forecast depend on two separate events: when guests book, and when they actually travel. A booking made today might correspond to a trip three days from now or three months from now. The distribution of that gap, what we call the lead-time composition, drives how we translate today’s bookings into future revenue (see Figure 1).The pandemic r…

3 weeks, 4 days назад @ medium.com
From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership
From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership

How a complex, large-scale migration to an in-house observability platform led to superior tooling, consistent data, and a fundamental reset of the developer experience.By: Callum Jones, Rong HuObservability — the function of providing visibility into the performance and reliability of applications using metrics, logs and traces — is one of the most important tools of the Infrastructure group at any company. Without a reliable, cost-effective, and user-friendly observability platform, you limit an organization’s ability to empower engineers to assess, support, and improve the reliability of their application.Like many of its peers, Airbnb started out by outsourcing its observability needs t…

1 month назад @ medium.com
Recommending Travel Destinations to Help Users Explore
Recommending Travel Destinations to Help Users Explore Recommending Travel Destinations to Help Users Explore

How we built a destination recommendation model that helps users spark inspiration and narrow down choices to make journeys smoother.By: Weiwei Guo, Bin Xu, Sundara Rajan Srinivasavaradhan, Jie Tang, Xiaowei Liu, Bharathi Thangamani, Liwei He, Huiji Gao, Tracy Yu, Hui Gao, Stephanie Moyerman, Sanjeev KatariyaAirbnb users in the trip planning stage may not have a clear idea of travel destinations, travel dates, or other preferences. They exhibit different behaviors compared to users who have a clear itinerary in mind. More exploratory users visit the Airbnb platform less often and are less likely to book listings in the near future; they’re more likely to search for a broad area such as “Fra…

1 month, 1 week назад @ medium.com
It Wasn’t a Culture Problem: Upleveling Alert Development at Airbnb
It Wasn’t a Culture Problem: Upleveling Alert Development at Airbnb It Wasn’t a Culture Problem: Upleveling Alert Development at Airbnb

How we changed our Observability as Code alert review process and cut development cycles from weeks to minutes.Observability as Code (OaC) — defining alerts, dashboards, and SLOs via code rather than UI — is table stakes for large engineering organizations. With OaC, observability adopts software development’s version control, code review, and testing processes, achieving the same level of discipline as a result. At Airbnb’s scale (thousands of engineers and services), this is the foundation that lets teams ship confidently while maintaining the reliability our guests and hosts depend on.Yet there’s a critical gap in most OaC workflows. While we bring rigor to alert definitions through code…

1 month, 2 weeks назад @ medium.com
Academic Publications & Airbnb Tech: 2025 Year in Review
Academic Publications & Airbnb Tech: 2025 Year in Review Academic Publications & Airbnb Tech: 2025 Year in Review

2025 was a big year for research at Airbnb, as we made significant progress toward our mission to use AI, data science, and machine learning to become the best travel and living platform.Specifically, we doubled down on our presence at long-standing venues like KDD and CIKM — two of the most selective conferences in machine learning. At the same time, we expanded our research footprint by sharing our work in NLP, optimization, and measurement science at conferences such as COLING, LION, and VLDB.Across these conferences, Airbnb researchers engaged directly with academic and industry peers by publishing and presenting papers, learning about the latest innovations, launching new collaboration…

1 month, 3 weeks назад @ medium.com
Safeguarding Dynamic Configuration Changes at Scale
Safeguarding Dynamic Configuration Changes at Scale Safeguarding Dynamic Configuration Changes at Scale

How Airbnb ships dynamic config changes safely and reliablyBy Cosmo Qiu, Bo Teng, Siyuan Zhou, Ankur Soni, Willis HarveyDynamic configuration is a core infrastructure capability in modern systems. It allows developers to change runtime behavior without restarting or redeploying services, even as the number of services and requests grows. In practice, that might mean rolling out a new address form for a region launch, tightening an authorization rule, or adjusting timeouts when a dependency is slow.Like any powerful tool, dynamic configuration is a double-edged sword. While it enables fast iteration and rapid incident response, a bad change can cause regressions or even outages. This is a co…

1 month, 4 weeks назад @ medium.com
My Journey to Airbnb — Anna Sulkina
My Journey to Airbnb — Anna Sulkina My Journey to Airbnb — Anna Sulkina

Anna Sulkina has always been a traveler, and we’re lucky her travels have brought her to Airbnb. Anna is a Senior Director of Engineering, and she’s responsible for Application & Cloud infrastructure. She brings over two decades of industry experience to Airbnb, including work spanning the stack from the frontend to the backend to the plumbing that makes everything come together. Anna is a mother, a passionate trail runner, and an accomplished leader. Here’s Anna’s story in her own words.Discovering a passion after the Soviet UnionI grew up in Eastern Ukraine, and the year I was graduating from high school, the Soviet Union collapsed. Despite the political turmoil, it was an interesting tim…

2 months назад @ medium.com
My Journey to Airbnb: Peter Coles
My Journey to Airbnb: Peter Coles My Journey to Airbnb: Peter Coles

Public school to PhDThe story of Airbnb’s Head Economist for Policy and Director of Data Science involves geology, co-teaching with a Nobel Prize winner, and CSI. (No, not the hit TV franchise.)Peter Coles was born and raised in Milwaukee, Wisconsin. He studied math at Princeton, earned his PhD in economics at Stanford, and taught at Harvard Business School before joining eBay and becoming a Data Science leader at Airbnb.As you’ll see from his story, Peter has a deep interest in how marketplaces work. By transitioning from academia to the business world, he not only gets to study first-hand data about millions of guests and hosts, but also to influence product and policy decisions. And he s…

2 months, 2 weeks назад @ medium.com
Pay As a Local
Pay As a Local Pay As a Local

How Airbnb rolled out 20+ locally relevant payment methods worldwide in just 14 monthsBy: Gerum Haile, Bo Shi, Yujia Liu, Yanwei Bai, Bo Yuan, Rory MacQueen, Yixia MaoAcross the more than 220 global markets that Airbnb operates in, cards are the primary way that guests pay for stays, experiences, and services. However, to help make our platform accessible to more people, reduce friction at checkout, and drive more adoption, we introduced trusted, locally preferred payment methods — called local payment methods or LPMs. By offering and supporting these payment methods, Airbnb enables guests everywhere to choose what works best for them.In this blog post, we’ll discuss the implementation deta…

3 months назад @ medium.com
GraphQL Data Mocking at Scale with LLMs and @generateMock
GraphQL Data Mocking at Scale with LLMs and @generateMock GraphQL Data Mocking at Scale with LLMs and @generateMock

How Airbnb combines GraphQL infra, product context, and LLMs to generate and maintain convincing, type-safe mock data using a new directive.IntroductionProducing valid and realistic mock data for testing and prototyping with GraphQL has been a persistent challenge across the industry for years. Mock data is tedious to write and maintain, and attempts to improve the process, such as random value generation and field-level stubbing, fall short because they lack essential domain context to make test data realistic and meaningful. The time spent on this manual work ultimately takes away from what most engineers would like to focus on: building features.In this post, we’ll explore how we’ve reim…

5 months, 2 weeks назад @ medium.com
From Static Rate Limiting to Adaptive Traffic Management in Airbnb’s Key-Value Store
From Static Rate Limiting to Adaptive Traffic Management in Airbnb’s Key-Value Store From Static Rate Limiting to Adaptive Traffic Management in Airbnb’s Key-Value Store

How Airbnb hardened Mussel, our key-value store, with smarter traffic controls to stay fast and reliable during traffic spikes.By Shravan Gaonkar, Casey Getz, Wonhee ChoIntroductionEvery request lookup on Airbnb, from stays, experiences, and services search to customer support inquiries ultimately hits Mussel, our multi-tenant key-value store for derived data. Mussel operates as a proxy service, deployed as a fleet of stateless dispatchers — each a Kubernetes pod. On a typical day, this fleet handles millions of predictable point and range reads. During peak events, however, it must absorb several-fold higher volume, terabyte-scale bulk uploads, and sudden bursts from automated bots or DDoS…

6 months, 1 week назад @ medium.com
Building a Next-Generation Key-Value Store at Airbnb
Building a Next-Generation Key-Value Store at Airbnb Building a Next-Generation Key-Value Store at Airbnb

By Shravan Gaonkar, Chandramouli Rangarajan, Yanhan ZhangHow we completely rearchitected Mussel, our storage engine for derived data, and lessons learned from the migration from Mussel V1 to V2.Airbnb’s core key-value store, internally known as Mussel, bridges offline and online workloads, providing highly scalable bulk load capabilities combined with single-digit millisecond reads.Since first writing about Mussel in a 2022 blog post, we have completely deprecated the storage backend of the original system (what we now call Mussel v1) and have replaced it with a NewSQL backend which we are referring to as Mussel v2. Mussel v2 has been running successfully in production for a year, and we wa…

6 months, 3 weeks назад @ medium.com
Netflix Engineering Netflix Engineering
последний пост 9 months, 1 week назад
Behind the Streams: Live at Netflix. Part 1
Behind the Streams: Live at Netflix. Part 1 Behind the Streams: Live at Netflix. Part 1

Behind the Streams: Three Years Of Live at Netflix. Part 1.By Sergey Fedorov, Chris Pham, Flavio Ribeiro, Chris Newton, and Wei WeiMany great ideas at Netflix begin with a question, and three years ago, we asked one of our boldest yet: if we were to entertain the world through Live — a format almost as old as television itself — how would we do it?What began with an engineering plan to pave the path towards our first Live comedy special, Chris Rock: Selective Outrage, has since led to hundreds of Live events ranging from the biggest comedy shows and NFL Christmas Games to record-breaking boxing fights and becoming the home of WWE.In our series Behind the Streams — where we take you through …

9 months, 1 week назад @ netflixtechblog.com
Netflix Tudum Architecture: from CQRS with Kafka to CQRS with RAW Hollow
Netflix Tudum Architecture: from CQRS with Kafka to CQRS with RAW Hollow Netflix Tudum Architecture: from CQRS with Kafka to CQRS with RAW Hollow

By Eugene Yemelyanau, Jake GriceIntroductionTudum.com is Netflix’s official fan destination, enabling fans to dive deeper into their favorite Netflix shows and movies. Tudum offers exclusive first-looks, behind-the-scenes content, talent interviews, live events, guides, and interactive experiences. “Tudum” is named after the sonic ID you hear when pressing play on a Netflix show or movie. Attracting over 20 million members each month, Tudum is designed to enrich the viewing experience by offering additional context and insights into the content available on Netflix.Initial architectureAt the end of 2021, when we envisioned Tudum’s implementation, we considered architectural patterns that wo…

9 months, 1 week назад @ netflixtechblog.com
Driving Content Delivery Efficiency Through Classifying Cache Misses
Driving Content Delivery Efficiency Through Classifying Cache Misses Driving Content Delivery Efficiency Through Classifying Cache Misses

By Vipul Marlecha, Lara Deek, Thiara OrtizThe mission of Open Connect, our dedicated content delivery network (CDN), is to deliver the best quality of experience (QoE) to our members. By localizing our Open Connect Appliances (OCAs), we bring Netflix content closer to the end user. This is achieved through close partnerships with internet service providers (ISPs) worldwide. Our ability to efficiently localize traffic, known as Content Delivery Efficiency, is a critical component of Open Connect’s service.In this post, we discuss one of the frameworks we use to evaluate our efficiency and identify sources of inefficiencies. Specifically, we classify the causes of traffic not being served fro…

9 months, 2 weeks назад @ netflixtechblog.com
AV1 @ Scale: Film Grain Synthesis, The Awakening
AV1 @ Scale: Film Grain Synthesis, The Awakening AV1 @ Scale: Film Grain Synthesis, The Awakening

Unleashing Film Grain Synthesis on Netflix and Enhancing Visuals for MillionsLi-Heng Chen, Andrey Norkin, Liwei Guo, Zhi Li, Agata Opalach and Anush MoorthyPicture this: you’re watching a classic film, and the subtle dance of film grain adds a layer of authenticity and nostalgia to every scene. This grain, formed from tiny particles during the film’s development, is more than just a visual effect. It plays a key role in storytelling by enhancing the film’s depth and contributing to its realism. However, film grain is as elusive as it is beautiful. Its random nature makes it notoriously difficult to compress. Traditional compression algorithms struggle to manage it, often forcing a choice be…

9 months, 2 weeks назад @ netflixtechblog.com
Pinterest Engineering
последний пост 3 days, 9 hours назад
Finding zombies in our systems: A real-world story of CPU bottlenecks
Finding zombies in our systems: A real-world story of CPU bottlenecks Finding zombies in our systems: A real-world story of CPU bottlenecks

Vaibhav Shankar; Staff Software Engineer | Raymond Lee; Staff Software Engineer | Chia-Wei Chen; Staff Software Engineer | Shunyao Li; Sr. Software Engineer | Yi Li; Staff Software Engineer | Ambud Sharma; Principal Engineer | Saurabh Vishwas Joshi; Principal Engineer | Charles-A. Francisco; Senior Engineer | Karthik Anantha Padmanabhan; Director, Engineering | David Westbrook; Sr. Manager, EngineeringOne day in early 2025, the Kubernetes platform team at Pinterest (PinCompute) got a ping from our partners on the ML platform team. Their Ray-based training jobs , which often take hours of computation on expensive GPU hardware, were crashing. Not every time, but often enough that it was becom…

3 days, 9 hours назад @ medium.com
Scaling Recommendation Systems with Request-Level Deduplication
Scaling Recommendation Systems with Request-Level Deduplication Scaling Recommendation Systems with Request-Level Deduplication

Authors: Matt Lawhon | Sr. Machine Learning Engineer; Filip Ryzner | Machine Learning Engineer II; Kousik Rajesh | Machine Learning Engineer II; Chen Yang | Sr. Staff Machine Learning Engineer; Saurabh Vishwas Joshi | Principal EngineerAt Pinterest, scaling our recommendation models delivers outsized impact on the quality of the content we serve to users. Our Foundation Model (oral spotlight, ACM RecSys 2025), for example, achieved a 100x increase in transformer dense parameter counts and a 10x increase in model dimension; translating directly into meaningful quality improvements across multiple recommendation surfaces.¹But a 100x scaleup creates massive infrastructure pressure. Storage, tr…

5 days, 6 hours назад @ medium.com
Performance for Everyone
Performance for Everyone Performance for Everyone

Author: Lin Wang (Android Performance Engineer)Default FeatureFor mobile apps, performance is considered as the “default feature”, which means apps are expected to run fast and be responsive. It’s just as if we expect a watch to show the time. With no exceptions at Pinterest, we measure, protect and improve performance for all of our key user experiences’ surfaces, such as “Home Feed” and “Search Result Feed”.Hard to MeasureAmong all the performance metrics, the user perceived latency is a crucial one. It measures how much time the user spends since they perform an action until they see the content. This is also called “Visually Complete”.Visually Complete can be very different from app to …

1 week, 3 days назад @ medium.com
Evolution of Multi-Objective Optimization at Pinterest Home feed
Evolution of Multi-Objective Optimization at Pinterest Home feed Evolution of Multi-Objective Optimization at Pinterest Home feed

Homefeed: Jiacong He, Dafang He, Jie Cheng (former), Andreanne Lemay, Mostafa Keikha, Rahul Goutam, Dhruvil Deven Badani, Dylan WangContent Quality: Jianing Sun, Qinglong ZengIntroductionIn feed recommendation, we recommend a list of items for the user to consume. It’s typically handled separately from the ranking model where we give probability predictions of user-item pairs.Pinterest’s feed recommendation follows a cascaded system design with retrieval [1][2], pre-ranking [3], ranking [4][5], and re-ranking. While most of these prior works focus on optimizing immediate actions for each candidate Pin, this work will primarily focus on how we build the final layer of the recommendation funn…

1 week, 4 days назад @ medium.com
Building an MCP Ecosystem at Pinterest
Building an MCP Ecosystem at Pinterest Building an MCP Ecosystem at Pinterest

Tan Wang | Software Engineer, Agent FoundationsOver the last year, Pinterest has gone from “MCP sounds interesting” to running a growing ecosystem of Model Context Protocol (MCP) servers, a central registry, and production integrations in our IDEs, internal chat surfaces, and AI agents. This post walks through what we’ve built so far, how we designed it, and where we’re taking MCP next.What Is MCP and Why Did We Care?Model Context Protocol (MCP) is an open-source standard that lets large language models talk to tools and data sources over a unified client-server protocol, instead of bespoke, one-off integrations for every model and every tool. At Pinterest, we’re using MCP as the substrate …

1 month назад @ medium.com
Unified Context-Intent Embeddings for Scalable Text-to-SQL
Unified Context-Intent Embeddings for Scalable Text-to-SQL Unified Context-Intent Embeddings for Scalable Text-to-SQL

Your Analysts Already Wrote the Perfect PromptAuthors: Keqiang Li, Bin YangIn our previous blog post, we shared how Pinterest built Text-to-SQL with RAG-based table selection (Retrieval-Augmented Generation). That system introduced schema-grounded SQL generation and retrieval-augmented table selection. These were important first steps, but not enough for reliable analytics at Pinterest scale.The challenge was fundamental: with over 100,000 analytical tables and 2,500+ analytical users across dozens of domains, simple keyword matching and table summaries were not enough. When an analyst asks “What’s the engagement rate for organic content by country?”, they need more than a list of tables wi…

1 month, 1 week назад @ medium.com
Unifying Ads Engagement Modeling Across Pinterest Surfaces
Unifying Ads Engagement Modeling Across Pinterest Surfaces Unifying Ads Engagement Modeling Across Pinterest Surfaces

Authors: Duna Zhan | Machine Learning Engineer II; Qifei Shen | Senior Staff Machine Learning Engineer; Matt Meng | Staff Machine Learning Engineer; Jiacheng Li | Machine Learning Engineer II; Hongda Shen | Staff Machine Learning EngineerIntroductionPinterest ads show up across multiple product surfaces, such as the Home Feed, Search, and Related Pins. Each surface has different user intent and different feature availability, but they all rely on the same core capability: predicting how likely a user is to engage with an ad.Before this project, the ads engagement stack relied on three independent production models, one per surface. Although the models were initially derived from a similar d…

1 month, 2 weeks назад @ medium.com
Bridging the Gap: Diagnosing Online–Offline Discrepancy in Pinterest’s L1 Conversion Models
Bridging the Gap: Diagnosing Online–Offline Discrepancy in Pinterest’s L1 Conversion Models Bridging the Gap: Diagnosing Online–Offline Discrepancy in Pinterest’s L1 Conversion Models

Authors: Yao Cheng | Senior Machine Learning Engineer; Qingmengting Wang | Machine Learning Engineer II; Yuanlu Bai | Machine Learning Engineer II; Yuan Wang | Machine Learning Engineer II; Zhaohong Han | Machine Learning Engineer Manager ; Jinfeng Zhuang | Senior Machine Learning Engineer ManagerIntroductionThe L1 ranking stage sits in the middle of Pinterest’s ads funnel. It filters and prioritizes candidates under tight latency constraints so that downstream ranking and auction systems only see a manageable set of ads.When we started pushing new L1 conversion (CVR) models, we saw the same pattern repeatedly:Offline: strong, consistent gains on loss and calibration across log sources and …

1 month, 2 weeks назад @ medium.com
Piqama: Pinterest Quota Management Ecosystem
Piqama: Pinterest Quota Management Ecosystem Piqama: Pinterest Quota Management Ecosystem

Authors: Junkai Xue | Sr Staff Software Engineer, Big Data Processing Platform; Zheyu Zha | Staff Software Engineer, Big Data Processing Platform; Jia Zhan | Principal Engineer, Online Systems; Alberto Ordonez Pereira | Sr Staff Software Engineer, Online SystemsOverviewA quota is an official limit on the usage or production of a specific resource. At Pinterest, we are developing a robust, generic quota management platform (Piqama) designed to manage a wide range of resources — including physical resources like memory and CPU, service resources such as QPS (queries per second) and network bandwidth, as well as application-specific quota units. Our ecosystem provides seamless quota lifecycle …

1 month, 3 weeks назад @ medium.com
Drastically Reducing Out-of-Memory Errors in Apache Spark at Pinterest
Drastically Reducing Out-of-Memory Errors in Apache Spark at Pinterest Drastically Reducing Out-of-Memory Errors in Apache Spark at Pinterest

Felix Loesing | Software EngineerIn 2025, we set out to drastically reduce out-of-memory errors (OOMs) and cut resource usage in our Spark applications by automatically identifying tasks with higher memory demands and retrying them on larger executors with a feature we call Auto Memory Retries.Spark PlatformPinterest runs a large-scale Apache Spark deployment to satisfy the increasing demands of internal customers, such as AI/ML, experimentation, and reporting. We process 90k+ Spark jobs daily on tens of thousands of compute nodes with hundreds of PB in shuffle size.¹ Our clusters are run on Kubernetes and mainly use Spark 3.2, with an upgrade to Spark 3.5 in progress. We use Apache Celebor…

2 months назад @ medium.com
GPU-Serving Two-Tower Models for Lightweight Ads Engagement Prediction
GPU-Serving Two-Tower Models for Lightweight Ads Engagement Prediction GPU-Serving Two-Tower Models for Lightweight Ads Engagement Prediction

Yuanlu Bai | Machine Learning Engineer II, L1 Conversion and Shopping Modeling; Yao Cheng | Sr. Machine Learning Engineer, L1 Conversion and Shopping Modeling; Xiao Yang | Sr. Staff Machine Learning Engineer, Ads Lightweight Ranking; Zhaohong Han | Manager II, Ads Lightweight Ranking; Jinfeng Zhuang | Sr. Manager, Ads RankingIntroductionLightweight ranking plays a crucial role as an intermediate stage in Pinterest’s ads recommendation system. Its main purpose is to efficiently narrow down the set of candidate ads before passing them to downstream, more complex ranking models. By doing so, it ensures that only the most relevant candidates move forward, improving both the efficiency and quali…

2 months назад @ medium.com
Next Generation DB Ingestion at Pinterest
Next Generation DB Ingestion at Pinterest Next Generation DB Ingestion at Pinterest

Liang Mou | Staff Software Engineer, Logging PlatformYisheng Zhou | Software Engineer II, Logging PlatformElizabeth (Vi) Nguyen | Software Engineer I, Logging PlatformOwen Zhang | Senior Software Engineer, Logging PlatformIntroductionAs Pinterest has grown, the demand for a robust, real-time, and cost-effective database ingestion platform has become increasingly urgent. Our data ecosystem powers a diverse set of use cases — from analytics and machine learning to product features and business intelligence — all of which depend on timely and reliable data. However, our legacy ingestion landscape was built on batch-oriented workflows and a patchwork of database dump solutions, each developed a…

2 months, 1 week назад @ medium.com
Beyond Two Towers: Re-architecting the Serving Stack for Next-Gen Ads Lightweight Ranking Models…
Beyond Two Towers: Re-architecting the Serving Stack for Next-Gen Ads Lightweight Ranking Models… Beyond Two Towers: Re-architecting the Serving Stack for Next-Gen Ads Lightweight Ranking Models…

Beyond Two Towers: Re-architecting the Serving Stack for Next-Gen Ads Lightweight Ranking Models (Part 1)Authors: Xiao Yang | Senior Staff Machine Learning Engineer; Ang Xu | Principal Machine Learning Engineer; Yao Cheng | Senior Machine Learning Engineer; Yuanlu Bai | Machine Learning Engineer II; Yuan Wang | Machine Learning Engineer II; Sihan Wang | Staff Software Engineer; Ken Xuan | Senior Software EngineerIntroductionIn the world of large-scale recommendation systems, the “Two-Tower” model architecture has long been the industry standard for the retrieval and lightweight ranking stage. Its appeal lies in its elegant efficiency: one neural network tower encodes the user, another encod…

2 months, 2 weeks назад @ medium.com
Ads Candidate Generation using Behavioral Sequence Modeling
Ads Candidate Generation using Behavioral Sequence Modeling Ads Candidate Generation using Behavioral Sequence Modeling

Lakshmi Manoharan | Senior Machine Learning Engineer, Ads Vertical Modeling; Karthik Jayasurya | Staff Machine Learning Engineer, Ads Signals ; Ziwei Guo | Senior Machine Learning Engineer, Ads Vertical Modeling; Joy Xin | Machine Learning Engineer II, Ads Vertical Modeling; Alina Liviniuk | Machine Learning Engineer II, Ads Vertical ModelingContextAt Pinterest, ads are more than just advertisements; they are a vital part of the content ecosystem, designed to inspire users and connect them with products and ideas they love. Our goal is to surface the right ads at the right time, ensuring they seamlessly integrate into a user’s shopping journey and provide genuine value. To achieve this, und…

2 months, 2 weeks назад @ medium.com
PinLanding: Turn Billions of Products into Instant Shopping Collections with Multimodal AI
PinLanding: Turn Billions of Products into Instant Shopping Collections with Multimodal AI PinLanding: Turn Billions of Products into Instant Shopping Collections with Multimodal AI

Faye Zhang, Staff Software Engineer; Jasmine Wan, Machine Learning Engineer I; Qianyu Cheng, Machine Learning Engineer II; Matthew Hichar, Machine Learning Engineer II; Eric Wan, Sr. Software Engineer; Jinfeng Rao, Sr. Staff Machine Learning EngineerOnline retailers and social platforms now operate catalogs with billions of items. Pinterest is one example, but the underlying challenge of how to organize products into precise, navigable shopping collections at web scale is shared across large e‑commerce and social discovery systems. Historically, collections have been derived from user search history and manual curation. In the age of multimodal large language models (LLMs), it is now possib…

3 months назад @ medium.com
Facebook
последний пост 2 days, 9 hours назад
Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale
Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

We’re sharing insights into Meta’s Capacity Efficiency Program, where we’ve built an AI agent platform that helps automate finding and fixing performance issues throughout our infrastructure. By leveraging encoded domain expertise across a unified, standardized tool interface these agents help save power and free up engineers’ time away from addressing performance issues to innovating on [...]

Read More...

The post Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale appeared first on Engineering at Meta.

2 days, 9 hours назад @ engineering.fb.com
How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines
How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

AI coding assistants are powerful but only as good as their understanding of your codebase. When we pointed AI agents at one of Meta’s large-scale data processing pipelines – spanning four repositories, three languages, and over 4,100 files – we quickly found that they weren’t making useful edits quickly enough. We fixed this by building [...]

Read More...

The post How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines appeared first on Engineering at Meta.

1 week, 5 days назад @ engineering.fb.com
KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure
KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

This is the second post in the Ranking Engineer Agent blog series exploring the autonomous AI capabilities accelerating Meta’s Ads Ranking innovation. The previous post introduced Ranking Engineer Agent’s ML exploration capability, which autonomously designs, executes, and analyzes ranking model experiments. This post covers how to optimize the low-level infrastructure that makes those models run [...]

Read More...

The post KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure appeared first on Engineering at Meta.

2 weeks, 2 days назад @ engineering.fb.com
Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads
Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

Meta continues to lead the industry in utilizing groundbreaking AI Recommendation Systems (RecSys) to deliver better experiences for people, and better results for advertisers. To reach the next frontier of performance, we are scaling Meta’s Ads Recommender runtime models to LLM-scale & complexity to further a deeper understanding of people’s interests and intent. This increase [...]

Read More...

The post Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads appeared first on Engineering at Meta.

2 weeks, 4 days назад @ engineering.fb.com
AI for American-Produced Cement and Concrete
AI for American-Produced Cement and Concrete

Meta is continuing its long-term roadmap to help the construction industry leverage AI to produce high-quality and more sustainable concrete mixes, as well as those exclusively produced in the United States. Concurrent with the 2026 American Concrete Institute (ACI) Spring Convention, Meta is releasing a new AI model for designing concrete mixes – Bayesian Optimization [...]

Read More...

The post AI for American-Produced Cement and Concrete appeared first on Engineering at Meta.

2 weeks, 5 days назад @ engineering.fb.com
Friend Bubbles: Enhancing Social Discovery on Facebook Reels
Friend Bubbles: Enhancing Social Discovery on Facebook Reels

Friend bubbles in Facebook Reels highlight Reels your friends have liked or reacted to, helping you discover new content and making it easier to connect over shared interests. This article explains the technical architecture behind friend bubbles, including how machine learning estimates relationship strength and ranks content your friends have interacted with to create more [...]

Read More...

The post Friend Bubbles: Enhancing Social Discovery on Facebook Reels appeared first on Engineering at Meta.

1 month назад @ engineering.fb.com
Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation
Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation

Meta’s Ranking Engineer Agent (REA) autonomously executes key steps across the end-to-end machine learning (ML) lifecycle for ads ranking models. This post covers REA’s ML experimentation capabilities: autonomously generating hypotheses, launching training jobs, debugging failures, and iterating on results. Future posts will cover additional REA capabilities. REA reduces the need for manual intervention. It manages [...]

Read More...

The post Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation appeared first on Engineering at Meta.

1 month назад @ engineering.fb.com
Patch Me If You Can: AI Codemods for Secure-by-Default Android Apps
Patch Me If You Can: AI Codemods for Secure-by-Default Android Apps

Even seemingly simple engineering tasks — like updating an API — can become monumental undertakings when you’re dealing with millions of lines of code and thousands of engineers, especially if the changes are security-related. Nowhere is this more apparent than in mobile security, where a single class of vulnerability can be replicated across hundreds of [...]

Read More...

The post Patch Me If You Can: AI Codemods for Secure-by-Default Android Apps appeared first on Engineering at Meta.

1 month назад @ engineering.fb.com
RCCLX: Innovating GPU communications on AMD platforms
RCCLX: Innovating GPU communications on AMD platforms

We are open-sourcing the initial version of RCCLX – an enhanced version of RCCL that we developed and tested on Meta’s internal workloads. RCCLX is fully integrated with Torchcomms and aims to empower researchers and developers to accelerate innovation, regardless of their chosen backend. Communication patterns for AI models are constantly evolving, as are hardware [...]

Read More...

The post RCCLX: Innovating GPU communications on AMD platforms appeared first on Engineering at Meta.

1 month, 3 weeks назад @ engineering.fb.com
The Death of Traditional Testing: Agentic Development Broke a 50-Year-Old Field, JiTTesting Can Revive It
The Death of Traditional Testing: Agentic Development Broke a 50-Year-Old Field, JiTTesting Can Revive It

WHAT IT IS The rise of agentic software development means code is being written, reviewed, and shipped faster than ever before across the entire industry. It also means that testing frameworks need to evolve for this rapidly changing landscape. Faster development demands faster testing that can catch bugs as they land in a codebase, without [...]

Read More...

The post The Death of Traditional Testing: Agentic Development Broke a 50-Year-Old Field, JiTTesting Can Revive It appeared first on Engineering at Meta.

2 months назад @ engineering.fb.com
Adapting the Facebook Reels RecSys AI Model Based on User Feedback
Adapting the Facebook Reels RecSys AI Model Based on User Feedback

We’ve improved personalized video recommendations on Facebook Reels by moving beyond metrics such as likes and watch time and directly leveraging user feedback. Our new User True Interest Survey (UTIS) model, now helps surface more niche, high-quality content and boosts engagement, retention, and satisfaction. We’re doubling down on personalization, tackling challenges like sparse user data [...]

Read More...

The post Adapting the Facebook Reels RecSys AI Model Based on User Feedback appeared first on Engineering at Meta.

3 months назад @ engineering.fb.com
DrP: Meta’s Root Cause Analysis Platform at Scale
DrP: Meta’s Root Cause Analysis Platform at Scale

Incident investigation can be a daunting task in today’s digital landscape, where large-scale systems comprise numerous interconnected components and dependencies DrP is a root cause analysis (RCA) platform, designed by Meta, to programmatically automate the investigation process, significantly reducing the mean time to resolve (MTTR) for incidents and alleviating on-call toil Today, DrP is used [...]

Read More...

The post DrP: Meta’s Root Cause Analysis Platform at Scale appeared first on Engineering at Meta.

4 months назад @ engineering.fb.com
How AI Is Transforming the Adoption of Secure-by-Default Mobile Frameworks
How AI Is Transforming the Adoption of Secure-by-Default Mobile Frameworks

Meta’s secure-by-default frameworks wrap potentially unsafe OS and third-party functions, making security the default while preserving developer speed and usability. These frameworks are designed to closely mirror existing APIs, rely on public and stable interfaces, and maximize developer adoption by minimizing friction and complexity. Generative AI and automation accelerate the adoption of secure frameworks at [...]

Read More...

The post How AI Is Transforming the Adoption of Secure-by-Default Mobile Frameworks appeared first on Engineering at Meta.

4 months назад @ engineering.fb.com
Zoomer: Powering AI Performance at Meta’s Scale Through Intelligent Debugging and Optimization
Zoomer: Powering AI Performance at Meta’s Scale Through Intelligent Debugging and Optimization

We’re introducing Zoomer, Meta’s comprehensive, automated debugging and optimization platform for AI. Zoomer works across all of our training and inference workloads at Meta and provides deep performance insights that enable energy savings, workflow acceleration, and efficiency gains in our AI infrastructure. Zoomer has delivered training time reductions, and significant QPS improvements, making it the [...]

Read More...

The post Zoomer: Powering AI Performance at Meta’s Scale Through Intelligent Debugging and Optimization appeared first on Engineering at Meta.

4 months, 4 weeks назад @ engineering.fb.com
Open Source Is Good for the Environment
Open Source Is Good for the Environment

Most people have heard of open-source software. But have you heard about open hardware? And did you know open source can have a positive impact on the environment? On this episode of the Meta Tech Podcast, Pascal Hartig sits down with Dharmesh and Lisa to talk about all things open hardware, and Meta’s biggest announcements [...]

Read More...

The post Open Source Is Good for the Environment appeared first on Engineering at Meta.

5 months назад @ engineering.fb.com
Uber Engineering
последний пост None
Spotify Engineering Spotify Engineering
последний пост None
Ripple Engineering Ripple Engineering
последний пост None
Dmitry Anoshin recommends
Snowflake
последний пост None
Cloudera Cloudera
последний пост None
Smart Data
последний пост 5 days, 5 hours назад
Hidden AI, Real Risk: A Governance Roadmap For Mid-Market Organizations
Hidden AI, Real Risk: A Governance Roadmap For Mid-Market Organizations

The silent driver of decisions: Why mid-market companies need AI governance now, not after a crisis.

5 days, 5 hours назад @ smartdatacollective.com
Signal Or Noise? A Decision Tree For Evaluating Unusual Trading Activity
Signal Or Noise? A Decision Tree For Evaluating Unusual Trading Activity

From confusion to clarity: Using a decision tree to assess whether unusual trading activity truly matters.

5 days, 6 hours назад @ smartdatacollective.com
AI Agent Trends Shaping Data-Driven Businesses
AI Agent Trends Shaping Data-Driven Businesses

Smarter decisions, faster execution: How AI agents are redefining what data-driven businesses can achieve.

5 days, 6 hours назад @ smartdatacollective.com
How Data Analytics Helps Developers Deliver Better Tech Services
How Data Analytics Helps Developers Deliver Better Tech Services

A closer look at how developers use analytics and AI tools to improve performance, anticipate issues, and build smarter solutions for tech companies.

6 days, 5 hours назад @ smartdatacollective.com
Can Data Analytics Help Investors Outperform Warren Buffett
Can Data Analytics Help Investors Outperform Warren Buffett

Exploring whether AI and financial analytics can rival one of the greatest investing track records in history

1 week, 3 days назад @ smartdatacollective.com
Signals In The Noise: Using Media Monitoring To Manage Negative Publicity
Signals In The Noise: Using Media Monitoring To Manage Negative Publicity

Separate signal from noise: How proactive media monitoring turns negative chatter into manageable insights.

1 month, 1 week назад @ smartdatacollective.com
The Best AI Recruitment Software Solution: Transforming Hiring with Smarter Tech
The Best AI Recruitment Software Solution: Transforming Hiring with Smarter Tech

Beyond resume screening: The transformative power of AI to match talent, reduce bias, and save time.

1 month, 2 weeks назад @ smartdatacollective.com
AI Video Surveillance for Safer Businesses
AI Video Surveillance for Safer Businesses

Discover how artificial intelligence helps businesses detect threats faster and protect people, property, and profits.

1 month, 3 weeks назад @ smartdatacollective.com
Recurring Revenue Strategies for the AI Business Era
Recurring Revenue Strategies for the AI Business Era

Learn how subscriptions and usage-based pricing help AI companies create steady income, manage costs, and keep customers engaged over time.

1 month, 4 weeks назад @ smartdatacollective.com
How AI Supports Modern Penetration Testing
How AI Supports Modern Penetration Testing

Smart Data Collective has spent years talking about various ways busineses can use AI to help manage risks and make real-world decisions. Today we are going to talk about how AI-driven tools change the way testing is planned, executed, and reviewed. There are many reasons businesses are reevaluating how they test their systems as threats […]

1 month, 4 weeks назад @ smartdatacollective.com
How Data Analytics Can Help You Construct A Financial Weather Map
How Data Analytics Can Help You Construct A Financial Weather Map

See the financial forecast: Using data analytics to map economic trends and prepare your business.

2 months, 3 weeks назад @ smartdatacollective.com
AI Shows How Payment Delays Disrupt Your Business
AI Shows How Payment Delays Disrupt Your Business

More than a cash flow problem: How AI analytics shows the true cost of payment delays on your business.

2 months, 3 weeks назад @ smartdatacollective.com
Financial Analytics Shows The Hidden Cost Of Not Switching Systems
Financial Analytics Shows The Hidden Cost Of Not Switching Systems

Your biggest expense might be inaction: Using data to calculate the true cost of not upgrading.

2 months, 3 weeks назад @ smartdatacollective.com
How Teams Using Multi-Model AI Reduced Risk Without Slowing Innovation
How Teams Using Multi-Model AI Reduced Risk Without Slowing Innovation

The best of both worlds: Achieving robust risk reduction and rapid innovation with multi-model AI.

2 months, 3 weeks назад @ smartdatacollective.com
How Permutable AI is Advancing Macro Intelligence for Complex Global Markets
How Permutable AI is Advancing Macro Intelligence for Complex Global Markets

Navigating market complexity: How Permutable AI delivers next-level macro intelligence for global investors.

3 months назад @ smartdatacollective.com
Knoldus
последний пост None
We Cloud Data We Cloud Data
последний пост 5 days, 8 hours назад
Reclaiming time in Education Classrooms & Reimaging Learning
Reclaiming time in Education Classrooms & Reimaging Learning

For most teachers, the “dream of teaching” often hits a wall of reality: 10:00 PM grading sessions, the endless hunt for differentiated materials, and a growing mountain of administrative emails. You didn’t enter this profession to be a data entry clerk; you joined it to inspire students. As we track the latest AI in education […]

The post Reclaiming time in Education Classrooms & Reimaging Learning appeared first on WeCloudData.

5 days, 8 hours назад @ weclouddata.com
Building the Future of Connectivity: AI in Telecommunications
Building the Future of Connectivity: AI in Telecommunications

The telecommunications industry is undergoing a massive transformation. With the rise of 5G, IoT, and connected devices, telecom companies are managing unprecedented volumes of data and network complexity. This is where Artificial Intelligence in telecommunication becomes critical. From optimizing network performance to improving customer experience, AI in telecom is enabling providers to move from reactive […]

The post Building the Future of Connectivity: AI in Telecommunications appeared first on WeCloudData.

1 week, 5 days назад @ weclouddata.com
Understanding AI in Banking and Finance
Understanding AI in Banking and Finance

In 2026, the financial sector has moved past the “experimentation” phase. We are now in the era of applied AI in banking and finance, where the difference between a market leader and a laggard is defined by how effectively they orchestrate intelligent systems. Whether you are a retail banker, a hedge fund analyst, or a […]

The post Understanding AI in Banking and Finance appeared first on WeCloudData.

2 weeks, 4 days назад @ weclouddata.com
The Strategic Role of AI in Tourism and Entertainment
The Strategic Role of AI in Tourism and Entertainment

The world of travel and fun is changing fast. People no longer want boring brochures or fixed plans; today’s travelers expect quick, personal service that used to be impossible. This change is happening because of smart technology that connects what people want with the data to make it happen. For businesses, understanding the impact of […]

The post The Strategic Role of AI in Tourism and Entertainment appeared first on WeCloudData.

1 month, 1 week назад @ weclouddata.com
Semantic Communication Stack: Beyond Generative Copywriting in 2026
Semantic Communication Stack: Beyond Generative Copywriting in 2026

In the early 2020s, the conversation around AI for communications professionals was dominated by a single, narrow use case: “Can it write an article for me?” By 2026, that question has become obsolete. The industry has moved past the novelty of generative copywriting and entered the era of the Semantic Communication Stack. As global information […]

The post Semantic Communication Stack: Beyond Generative Copywriting in 2026 appeared first on WeCloudData.

1 month, 2 weeks назад @ weclouddata.com
AI in Agriculture: Transforming Farming Through Data, Intelligence, and Practical Skills
AI in Agriculture: Transforming Farming Through Data, Intelligence, and Practical Skills

Agriculture is entering a new technological era. As global populations grow and global foodwater scarcity intensifies, traditional farming methods alone can no longer sustain rising food production demands while minimizing environmental impact. Artificial intelligence is emerging as a critical solution — helping farmers, agribusinesses, and policymakers make smarter, faster, and more sustainable decisions. From predicting […]

The post AI in Agriculture: Transforming Farming Through Data, Intelligence, and Practical Skills appeared first on WeCloudData.

1 month, 2 weeks назад @ weclouddata.com
AI for Project Managers: Reimagining Traditional Project Management
AI for Project Managers: Reimagining Traditional Project Management

In the world of project management, there is a “silent thief” that no one likes to talk about. It’s not a missed deadline or a budget overrun. It’s the administrative burden. If you’re a Project Manager, you know the feeling. You spend 60% of your week in a cycle of “information chasing”: summarizing meeting notes, […]

The post AI for Project Managers: Reimagining Traditional Project Management appeared first on WeCloudData.

1 month, 4 weeks назад @ weclouddata.com
Building the Foundation for AI-Driven Research
Building the Foundation for AI-Driven Research

We have entered a new era of work. Information is no longer hard to find; it is everywhere. In fact, by 2025, over 1.2 billion websites exist, and hundreds of thousands of new pages are created every single day. For anyone in a research-heavy role whether you are an analyst, a student, or a strategist—the […]

The post Building the Foundation for AI-Driven Research appeared first on WeCloudData.

2 months назад @ weclouddata.com
Saudi AI Vision 2030: Leading the Future of Artificial Intelligence
Saudi AI Vision 2030: Leading the Future of Artificial Intelligence

The global race for technological supremacy has a new, formidable frontrunner: Saudi Arabia. As the Kingdom undergoes a historic transformation, the Saudi AI Vision 2030 has emerged as the heartbeat of its digital evolution. This isn’t just a tech upgrade; it’s a fundamental reimagining of a nation’s future. It’s shifting from an oil-dependent economy to […]

The post Saudi AI Vision 2030: Leading the Future of Artificial Intelligence appeared first on WeCloudData.

2 months, 1 week назад @ weclouddata.com
WeCloudData at ICAN 2026: Contributing to the Future of AI, Data, and Workforce Innovation
WeCloudData at ICAN 2026: Contributing to the Future of AI, Data, and Workforce Innovation

Riyadh is no longer just talking about the future; it is actively building the scaffolding for it. This past week at King Saud University, the ICAN 2026 (International Conference on Capacity Building in Data and AI) served as the epicenter for a global shift in how we think about human potential. Amidst the buzz of […]

The post WeCloudData at ICAN 2026: Contributing to the Future of AI, Data, and Workforce Innovation appeared first on WeCloudData.

2 months, 2 weeks назад @ weclouddata.com
Rise of the Data Generalist: Why Hybrid Skills Matter in Data Economy
Rise of the Data Generalist: Why Hybrid Skills Matter in Data Economy

For years, the data job market revolved around specialists: data analysts who wrote SQL all day, data engineers who built pipelines, and data scientists who focused on machine learning models. Today, that model is changing. Organizations increasingly value professionals who can work across multiple stages of the data lifecycle—from extracting data to analyzing it, building […]

The post Rise of the Data Generalist: Why Hybrid Skills Matter in Data Economy appeared first on WeCloudData.

2 months, 3 weeks назад @ weclouddata.com
Rise of the Data Generalist: Why Hybrid Skills Matter in Data Economy
Rise of the Data Generalist: Why Hybrid Skills Matter in Data Economy

For years, the data job market revolved around specialists: data analysts who wrote SQL all day, data engineers who built pipelines, and data scientists who focused on machine learning models. Today, that model is changing. Organizations increasingly value professionals who can work across multiple stages of the data lifecycle—from extracting data to analyzing it, building […]

The post Rise of the Data Generalist: Why Hybrid Skills Matter in Data Economy appeared first on WeCloudData.

2 months, 3 weeks назад @ weclouddata.com
Decision Science and AI: How Artificial Intelligence Is Transforming Decision-Making
Decision Science and AI: How Artificial Intelligence Is Transforming Decision-Making

Data is abundant, but good decisions are not automatic. Organizations increasingly recognize that analytics alone is insufficient—they need structured methods to turn insights into action. This is where decision science and AI intersect. Decision science provides the framework for making optimal choices under uncertainty. Artificial intelligence (AI) supplies the scale, speed, and predictive power to […]

The post Decision Science and AI: How Artificial Intelligence Is Transforming Decision-Making appeared first on WeCloudData.

3 months назад @ weclouddata.com
What is Decision Science: Scope and Career Opportunities
What is Decision Science: Scope and Career Opportunities

Organizations today are flooded with data but data alone does not lead to better outcomes. What truly creates value is the ability to turn data into consistent, repeatable, and high-quality decisions. This is where decision science plays a critical role. This article explains what is decision science, how it differs from related fields, real-world examples, […]

The post What is Decision Science: Scope and Career Opportunities appeared first on WeCloudData.

3 months, 1 week назад @ weclouddata.com
Data Governance: What It Is, Why It Matters, and How It Works
Data Governance: What It Is, Why It Matters, and How It Works

As organizations rely more heavily on data for analytics, AI, and business decision-making, one question keeps surfacing: who owns the data, who can use it, and how can it be trusted? The answer lies in data governance. A foundational discipline that ensures data is accurate, secure, compliant, and usable across the enterprise. This guide breaks […]

The post Data Governance: What It Is, Why It Matters, and How It Works appeared first on WeCloudData.

3 months, 2 weeks назад @ weclouddata.com
Learn Data Engineering
последний пост None
SCRIBD
последний пост 1 month, 3 weeks назад
Dual-Embedding Trust Scoring
Dual-Embedding Trust Scoring Dual-Embedding Trust Scoring

Scribd is a digital library serving academics and lifelong learners, offering hundreds of millions of documents. This very nature presents a significant concern: content trust and safety. Protecting our library from undesirable and unsafe content is a top priority, but the multilingual and multimodal (text and images) nature of our platform makes this mission very challenging. Also, while third-party tools exist, they often fall short, lacking the nuance to handle our specific trust and safety categories.

To this end, we capitalized on Generative AI (GenAI) signals and our proprietary multilingual embeddings, in conjunction with classical machine learning methods, to develop our Content Tru…

1 month, 3 weeks назад @ tech.scribd.com
Screaming in the Cloud
Screaming in the Cloud

Scribd has absolutely fascinating data-at-scale type problems, all the way

down to the fundamentals of how we use AWS S3. In my previous

post I wrote about the design of Content

Crush and how Scribd is consolidating objects in S3 to minimize our costs.

Related to that work I was fortunate enough to join the (in)famous Corey

Quinn to talk about Engineering around Extreme S3 scale:

Checking if files are damaged? $100K. Using newer S3 tools? Way too expensive.

Normal solutions don’t work anymore. Tyler shares how with this much data, you

can’t just throw money at the problem, but rather you have to engineer your way

out.

You can also listen

On Everand

or watch via the Last Week in AWS YouTube …

2 months, 1 week назад @ tech.scribd.com
Deploying a Cost-Effective, Scalable PhotoDNA System for CSAM Detection
Deploying a Cost-Effective, Scalable PhotoDNA System for CSAM Detection Deploying a Cost-Effective, Scalable PhotoDNA System for CSAM Detection

Child safety is a non‑negotiable responsibility for any platform that hosts user‑generated content. Over the last year, we designed and deployed a production system that detects known Child Sexual Abuse Material (CSAM) using PhotoDNA perceptual hashes, integrates with the National Center for Missing and Exploted Children’s (NCMEC) reporting system, and scales efficiently across our ingestion surfaces. This post explains the problem we set out to solve, how PhotoDNA hashing works, the online child-protection ecosystem (NCMEC, Tech Coalition, Project Lantern), our architecture and operational model, cost considerations, and key learnings.

Note: This article discusses safety technology at a hi…

2 months, 4 weeks назад @ tech.scribd.com
Supercharging S3 Intelligent Tiering with Content Crush
Supercharging S3 Intelligent Tiering with Content Crush Supercharging S3 Intelligent Tiering with Content Crush

Scribd and Slideshare have been using AWS S3 for almost twenty years and

store hundreds of billions of objects making storage management quite a

challenge. My focus at Scribd has generally been around data and storage but

only in the past twelve months have I started to really focus on one of our

hardest technology problems: cost-effective storage and availability for the

hundreds of billions of objects that represent our content library.

Since adopting S3 for our object storage in 2007 a lot has changed with the service, most

notably Intelligent

Tiering which was

introduced in

2018.

At a very high level Intelligent Tiering allows object access patterns to

dictate the storage tier for a sma…

3 months, 1 week назад @ tech.scribd.com
Don’t hardcode IAM credentials in GitHub!
Don’t hardcode IAM credentials in GitHub! Don’t hardcode IAM credentials in GitHub!

Scribd deploys a lot of code from GitHub to AWS using GitHub Actions, which

means many of our Actions need to access AWS resources. Managing AWS API keys

and tokens for different IAM users is time-consuming, brittle, and insecure.

Managing key-distribution between AWS and GitHub also makes it difficult to

track which keys go where, when they should be rotated, and what permissions

those keys have. Fortunately AWS supports creating OpenID Connect identity

providers

which is an ideal tool handle this kind of cross-cloud authentication in a more

maintainable way.

From the AWS documentation: IAM OIDC identity providers are entities in IAM that describe an external

identity provider (IdP) servic…

3 months, 1 week назад @ tech.scribd.com
Building a Scalable Data Warehouse Backup System with AWS
Building a Scalable Data Warehouse Backup System with AWS Building a Scalable Data Warehouse Backup System with AWS

We designed and implemented a scalable, cost-optimized backup system for S3 data warehouses that runs automatically on a monthly schedule. The system handles petabytes of data across multiple databases and uses a hybrid approach: AWS Lambda for small workloads and ECS Fargate for larger ones.

At its core, the pipeline performs incremental backups — copying only new or changed parquet files while always preserving delta logs — dramatically reducing costs and runtime compared to full backups. Data is validated through S3 Inventory manifests, processed in parallel, and stored in Glacier for long-term retention.

To avoid data loss and reduce storage costs, we also implemented a safe deletion wo…

6 months, 4 weeks назад @ tech.scribd.com
Let’s save tons of money with cloud-native data ingestion!
Let’s save tons of money with cloud-native data ingestion!

Delta Lake is a fantastic technology for quickly querying massive data sets,

but first you need those massive data sets! In this

talk from Data and AI

Summit 2025 I dive into the cloud-native

architecture Scribd has adopted to ingest data from AWS Aurora, SQS, Kinesis

Data Firehose and more!

By using off-the-shelf open source tools like kafka-delta-ingest, oxbow and

Airbyte, Scribd has redefined its ingestion architecture to be more

event-driven, reliable, and most importantly: cheaper. No jobs needed!

Attendees will learn how to use third-party tools in concert with a Databricks

and Unity Catalog environment to provide a highly efficient and available data

platform.

This architecture will …

8 months, 3 weeks назад @ tech.scribd.com
Data Quest
последний пост None
Infrastructure
AWS
последний пост 1 day, 3 hours назад
Introducing granular cost attribution for Amazon Bedrock
Introducing granular cost attribution for Amazon Bedrock

In this post, we share how Amazon Bedrock's granular cost attribution works and walk through example cost tracking scenarios.

1 day, 3 hours назад @ aws.amazon.com
Optimize video semantic search intent with Amazon Nova Model Distillation on Amazon Bedrock
Optimize video semantic search intent with Amazon Nova Model Distillation on Amazon Bedrock

In this post, we show you how to use Model Distillation, a model customization technique on Amazon Bedrock, to transfer routing intelligence from a large teacher model (Amazon Nova Premier) into a much smaller student model (Amazon Nova Micro). This approach cuts inference cost by over 95% and reduces latency by 50% while maintaining the nuanced routing quality that the task demands.

1 day, 5 hours назад @ aws.amazon.com
Power video semantic search with Amazon Nova Multimodal Embeddings
Power video semantic search with Amazon Nova Multimodal Embeddings

In this post, we show you how to build a video semantic search solution on Amazon Bedrock using Nova Multimodal Embeddings that intelligently understands user intent and retrieves accurate video results across all signal types simultaneously. We also share a reference implementation you can deploy and explore with your own content.

1 day, 5 hours назад @ aws.amazon.com
Nova Forge SDK series part 2: Practical guide to fine-tune Nova models using data mixing capabilities
Nova Forge SDK series part 2: Practical guide to fine-tune Nova models using data mixing capabilities

This hands-on guide walks through every step of fine-tuning an Amazon Nova model with the Amazon Nova Forge SDK, from data preparation to training with data mixing to evaluation, giving you a repeatable playbook you can adapt to your own use case. This is the second part in our Nova Forge SDK series, building on the SDK introduction and first part, which covered kicking off customization experiments.

1 day, 7 hours назад @ aws.amazon.com
From hours to minutes: How Agentic AI gave marketers time back for what matters
From hours to minutes: How Agentic AI gave marketers time back for what matters

In this post, we share how AWS Marketing’s Technology, AI, and Analytics (TAA) team worked with Gradial to build an agentic AI solution on Amazon Bedrock for accelerating content publishing workflows.

1 day, 8 hours назад @ aws.amazon.com
Enhancing Identity Intelligence with Babel Street Match and Amazon OpenSearch
Enhancing Identity Intelligence with Babel Street Match and Amazon OpenSearch

This post explores how combining Babel Street Match with OpenSearch Service provides a solution that helps your organization to handle large-scale, multilingual data.

2 days, 7 hours назад @ aws.amazon.com
Cost-efficient custom text-to-SQL using Amazon Nova Micro and Amazon Bedrock on-demand inference
Cost-efficient custom text-to-SQL using Amazon Nova Micro and Amazon Bedrock on-demand inference

In this post, we demonstrate two approaches to fine-tune Amazon Nova Micro for custom SQL dialect generation to deliver both cost efficiency and production ready performance.

2 days, 7 hours назад @ aws.amazon.com
Transform retail with AWS generative AI services
Transform retail with AWS generative AI services

Online retailers face a persistent challenge: shoppers struggle to determine the fit and look when ordering online, leading to increased returns and decreased purchase confidence. The cost? Lost revenue, operational overhead, and customer frustration. Meanwhile, consumers increasingly expect immersive, interactive shopping experiences that bridge the gap between online and in-store retail. Retailers implementing virtual try-on […]

2 days, 7 hours назад @ aws.amazon.com
How Automated Reasoning checks in Amazon Bedrock transform generative AI compliance
How Automated Reasoning checks in Amazon Bedrock transform generative AI compliance

In this post, you'll learn why probabilistic AI validation falls short in regulated industries and how Automated Reasoning checks use formal verification to deliver mathematically proven results. You'll also see how customers across six industries use this technology to produce formally verified, auditable AI outputs, and how to get started.

2 days, 7 hours назад @ aws.amazon.com
Build resilient Kerberos authentication for Aurora Global Database without joining Active Directory domain
Build resilient Kerberos authentication for Aurora Global Database without joining Active Directory domain

In this post, we show you how to build a multi-Region Kerberos authentication system that matches your Aurora Global Database’s resilience using AWS Directory Service for Microsoft Active Directory (AWS Managed Microsoft AD) with multi-Region replication and a one-way forest trust to your on-premises Active Directory, so your Linux clients can authenticate without joining the AD domain.

2 days, 8 hours назад @ aws.amazon.com
Getting started with Apache Iceberg write support in Amazon Redshift – Part 2
Getting started with Apache Iceberg write support in Amazon Redshift – Part 2

Amazon Redshift now supports DELETE, UPDATE, and MERGE operations for Apache Iceberg tables stored in Amazon S3 and Amazon S3 table buckets. With these operations, you can modify data at the row level, implement upsert patterns, and manage the data lifecycle while maintaining transactional consistency using familiar SQL syntax. You can run complex transformations in Amazon Redshift and write results to Apache Iceberg tables that other analytics engines like Amazon EMR or Amazon Athena can immediately query. In this post, you work with datasets to demonstrate these capabilities in a data synchronization scenario.

3 days, 3 hours назад @ aws.amazon.com
Get to insights faster using Notebooks in Amazon SageMaker Unified Studio
Get to insights faster using Notebooks in Amazon SageMaker Unified Studio

In this post, we demonstrate how Notebooks in Amazon SageMaker Unified Studio help you get to insights faster by simplifying infrastructure configuration. You'll see how to analyze housing price data, create scalable data tables, run distributed profiling, and train machine learning (ML) models within a single notebook environment.

3 days, 3 hours назад @ aws.amazon.com
Create rich, custom tooltips in Amazon Quick Sight
Create rich, custom tooltips in Amazon Quick Sight

Today, we're announcing sheet tooltips in Amazon Quick Sight. Dashboard authors can now design custom tooltip layouts using free-form layout sheets. These layouts combine charts, key performance indicator (KPI) metrics, text, and other visuals into a single tooltip that renders dynamically when readers hover over data points.

3 days, 10 hours назад @ aws.amazon.com
Accelerating decode-heavy LLM inference with speculative decoding on AWS Trainium and vLLM
Accelerating decode-heavy LLM inference with speculative decoding on AWS Trainium and vLLM

In this post, you will learn how speculative decoding works and why it helps reduce cost per generated token on AWS Trainium2.

3 days, 10 hours назад @ aws.amazon.com
Rede Mater Dei de Saúde: Monitoring AI agents in the revenue cycle with Amazon Bedrock AgentCore
Rede Mater Dei de Saúde: Monitoring AI agents in the revenue cycle with Amazon Bedrock AgentCore

This post is cowritten by Renata Salvador Grande, Gabriel Bueno and Paulo Laurentys at Rede Mater Dei de Saúde. The growing adoption of multi-agent AI systems is redefining critical operations in healthcare. In large hospital networks, where thousands of decisions directly impact cash flow, service delivery times, and the risk of claim denials, the ability […]

3 days, 10 hours назад @ aws.amazon.com
AWS
последний пост 1 day, 3 hours назад
Navigating the generative AI journey: The Path-to-Value framework from AWS
Navigating the generative AI journey: The Path-to-Value framework from AWS

In this post, we introduce the Generative AI Path-to-Value (P2V) framework, a structured approach to help you move generative AI initiatives from concept to production and sustained value creation.

4 days, 7 hours назад @ aws.amazon.com
Use-case based deployments on SageMaker JumpStart
Use-case based deployments on SageMaker JumpStart

We're excited to announce the launch of Amazon SageMaker JumpStart optimized deployments. SageMaker JumpStart improved deployments address the need for rich and straightforward deployment customization on SageMaker JumpStart by offering pre-defined deployment configurations, designed for specific use cases. Customers maintain the same level of visibility into the details of their proposed deployments, but now deployments are optimized for their specific use case and performance constraint.

4 days, 7 hours назад @ aws.amazon.com
Best practices to run inference on Amazon SageMaker HyperPod
Best practices to run inference on Amazon SageMaker HyperPod

This post explores how Amazon SageMaker HyperPod provides a comprehensive solution for inference workloads. We walk you through the platform’s key capabilities for dynamic scaling, simplified deployment, and intelligent resource management. By the end of this post, you’ll understand how to use the HyperPod automated infrastructure, cost optimization features, and performance enhancements to reduce your total cost of ownership by up to 40% while accelerating your generative AI deployments from concept to production.

4 days, 7 hours назад @ aws.amazon.com
How Guidesly built AI-generated trip reports for outdoor guides on AWS
How Guidesly built AI-generated trip reports for outdoor guides on AWS

In this post, we walk through how Guidesly built Jack AI on AWS using AWS Lambda, AWS Step Functions, Amazon Simple Storage Service (Amazon S3), Amazon Relational Database Service (Amazon RDS), Amazon SageMaker AI, and Amazon Bedrock to ingest trip media, enrich it with context, apply computer vision and generative AI, and publish marketing-ready content across multiple channels—securely, reliably, and at scale.

4 days, 7 hours назад @ aws.amazon.com
Improving storage with additional storage volumes in Amazon RDS for SQL Server
Improving storage with additional storage volumes in Amazon RDS for SQL Server

As SQL Server workloads grow on Amazon Relational Database Service (Amazon RDS) for Db2, the 64 TiB storage limit can force architectural issues that constrain business growth and create performance bottlenecks when transaction logs compete with data for I/O resources. The additional storage volumes feature in Amazon RDS for SQL Server solves these challenges. You can use Amazon RDS for SQL Server to attach additional storage volumes beyond the root volume, with each volume having different storage classes and performance characteristics. In this post, you will learn how to use the additional storage volumes feature in Amazon RDS for SQL Server to address these common challenges.

4 days, 9 hours назад @ aws.amazon.com
Accelerate database migration to Amazon Aurora DSQL with Kiro and Amazon Bedrock AgentCore
Accelerate database migration to Amazon Aurora DSQL with Kiro and Amazon Bedrock AgentCore

In this post, we walk through the steps to set up the custom migration assistant agent and migrate a PostgreSQL database to Aurora DSQL. We demonstrate how to use natural language prompts to analyze database schemas, generate compatibility reports, apply converted schemas, and manage data replication through AWS DMS. As of this writing, AWS DMS does not support Aurora DSQL as target endpoint. To address this, our solution uses Amazon Simple Storage Service (Amazon S3) and AWS Lambda functions as a bridge to load data into Aurora DSQL.

4 days, 9 hours назад @ aws.amazon.com
Spring AI SDK for Amazon Bedrock AgentCore is now Generally Available
Spring AI SDK for Amazon Bedrock AgentCore is now Generally Available

With the new Spring AI AgentCore SDK, you can build production-ready AI agents and run them on the highly scalable AgentCore Runtime. The Spring AI AgentCore SDK is an open source library that brings Amazon Bedrock AgentCore capabilities into Spring AI. In this post, we build an AI agent starting with a chat endpoint, then adding streaming responses, conversation memory, and tools for web browsing and code execution.

4 days, 12 hours назад @ aws.amazon.com
Troubleshooting environment with AI analysis in AWS Elastic Beanstalk
Troubleshooting environment with AI analysis in AWS Elastic Beanstalk

Introduction AWS Elastic Beanstalk simplifies the process of deploying and scaling web applications. You upload your code, and Elastic Beanstalk handles capacity provisioning, load balancing, auto scaling, and application health monitoring. Elastic Beanstalk now offers AI Analysis to help troubleshoot environment health issues. When you request an analysis, Elastic Beanstalk triggers a script on the […]

5 days, 6 hours назад @ aws.amazon.com
How to build effective reward functions with AWS Lambda for Amazon Nova model customization
How to build effective reward functions with AWS Lambda for Amazon Nova model customization

This post demonstrates how Lambda enables scalable, cost-effective reward functions for Amazon Nova customization. You'll learn to choose between Reinforcement Learning via Verifiable Rewards (RLVR) for objectively verifiable tasks and Reinforcement Learning via AI Feedback (RLAIF) for subjective evaluation, design multi-dimensional reward systems that help you prevent reward hacking, optimize Lambda functions for training scale, and monitor reward distributions with Amazon CloudWatch. Working code examples and deployment guidance are included to help you start experimenting.

5 days, 9 hours назад @ aws.amazon.com
How to use Parquet Column Indexes with Amazon Athena
How to use Parquet Column Indexes with Amazon Athena

In this blog post, we use Athena and Amazon SageMaker Unified Studio to explore Parquet Column Indexes and demonstrate how they can improve Iceberg query performance. We explain what Parquet Column Indexes are, demonstrate their performance benefits, and show you how to use them in your applications.

5 days, 9 hours назад @ aws.amazon.com
Options for changing AWS KMS encryption key for Amazon RDS databases
Options for changing AWS KMS encryption key for Amazon RDS databases

In this post, we review the options for changing the AWS KMS key on your Amazon RDS database instances and on your Amazon RDS and Aurora clusters. We start with the most common approach, which is the snapshot method, and then we include additional options to consider when performing this change on production instances and clusters that can mitigate downtime. Each of the approaches mentioned in this post can be used for cross-account or cross-Region sharing of the instance’s data while migrating it to a new AWS KMS key.

5 days, 9 hours назад @ aws.amazon.com
Implementing Kerberos authentication for Apache Spark jobs on Amazon EMR on EKS to access a Kerberos-enabled Hive Metastore
Implementing Kerberos authentication for Apache Spark jobs on Amazon EMR on EKS to access a Kerberos-enabled Hive Metastore

In this post, we show how to configure Kerberos authentication for Spark jobs on Amazon EMR on EKS, authenticating against a Kerberos-enabled HMS so you can run both Amazon EMR on EC2 and Amazon EMR on EKS workloads against a single, secure HMS deployment.

5 days, 9 hours назад @ aws.amazon.com
Connecting .NET Lambda to Amazon Aurora PostgreSQL via RDS Proxy
Connecting .NET Lambda to Amazon Aurora PostgreSQL via RDS Proxy

In this post, I show you how to connect Lambda functions to Aurora PostgreSQL using Amazon RDS Proxy. We cover how to configure AWS Secrets Manager, set up RDS Proxy, and create a C# Lambda function with secure credential caching. I provide a GitHub repository which contains a YAML-format AWS CloudFormation template to provision the key components demonstrated, a C# sample function. I also walk through the Lambda function deployment step by step.

5 days, 9 hours назад @ aws.amazon.com
Understanding Amazon Bedrock model lifecycle
Understanding Amazon Bedrock model lifecycle

This post shows you how to manage FM transitions in Amazon Bedrock, so you can make sure your AI applications remain operational as models evolve. We discuss the three lifecycle states, how to plan migrations with the new extended access feature, and practical strategies to transition your applications to newer models without disruption.

1 week, 2 days назад @ aws.amazon.com
The future of managing agents at scale: AWS Agent Registry now in preview
The future of managing agents at scale: AWS Agent Registry now in preview

Today, we're announcing AWS Agent Registry (preview) in AgentCore, a single place to discover, share, and reuse AI agents, tools, and agent skills across your enterprise.

1 week, 2 days назад @ aws.amazon.com
Astronomer Astronomer
последний пост None
DBT — Data Build Tool DBT — Data Build Tool
последний пост None
FiveTran FiveTran
последний пост None
DataBricks
последний пост None
Mix
/r/DataEngineering
последний пост 1 час назад
Certs or courses for a senior DE?
Certs or courses for a senior DE?

I see frequent questions from the juniors asking how to break in or move into a senior position, but I've let my AWS certs all lapse and I'm not sure if I want to renew them. I still work with AWS along with Snowflake very heavily. In a few years I want to jump to a senior principal or director. I love Snowflake so part of me figures I should target that line but I really want to be strategic for the market. Maybe I should get something I don't actually work with regularly to spread myself out but I don't want an unnecessary distraction if it won't add value. Thoughts? Courses that are valuable are also appreciated, some architecture principles are crosscutting and it would be nice to add s…

1 час назад @ reddit.com
Just passed the Databricks Data Engineer Professional – first at my company. How many of us are out there?
Just passed the Databricks Data Engineer Professional – first at my company. How many of us are out there?

I recently earned the Databricks Data Engineer Professional certification, and I’m the first person at my company to do so (it’s a medium-sized consulting firm). I’m from Europe, and I’d like to know how many other people have earned this certification, since I sometimes struggle to find people with whom I can have an interesting technical conversation. How did you prepare for the exam, and what aspects did you like the most or find most challenging? submitted by /u/PitOak-Q6 [link] [comments]

2 часа назад @ reddit.com
Preparing for architecture design questions
Preparing for architecture design questions

Hey folks, I've been a Senior Data Engineer for a few years now, mostly working on Python-based pipelines, SQL optimization, and cloud infrastructure. Lately I've been going deeper into large-scale system design and architecture and had some questions I couldn't find good answers to in the wiki. For those of you working at large-scale companies (think millions of events/day, multi-region, high availability requirements) — what do you find are the hardest architectural decisions to get right? Specifically curious about: - How do you approach designing pipelines that need to scale horizontally without becoming a maintenance nightmare? - What's your philosophy on performance tuning vs. just th…

3 часа назад @ reddit.com
What do you consider a senior level skillset?
What do you consider a senior level skillset?

So I've been in the analytics engineering-ish space for the past 6 years and for most of that time I was in research focused embedded business teams, and only recently moved to a more production level team in the last year or so. What I've seen a result of that however is that my skillset is a bit all over the place. I have very strong business/customer facing skills, project management, data discovery & pipeline prototyping all that. But talking about actual production pipeline management, working with proper CI/CD, cloud deployments and even working in the cloud (because I was in on prem mostly before :')) was only in the last year. So... I feel a bit in this weird limbo. I have exposure …

7 часов назад @ reddit.com
Looking for expert feedback on Power BI architecture for large-scale Customer Insights
Looking for expert feedback on Power BI architecture for large-scale Customer Insights

I’m working on a large-scale Customer Insights model in Power BI and looking for architectural advice. ~1 billion rows. Current setup: A customer-level table (with party_id + flags like gender, region, VIP, etc.) connected via DirectQuery, mainly for distinct counts (using approx distinct count). Multiple monthly pre-aggregated tables (by brand, category, store, product, etc.) with metrics like gross_amount, transactions_qty, items_qty. (these are fully additive metrics that don’t depend on distinct counts, so I can safely pre-aggregate them at monthly level without losing accuracy). I also use a business key like: channel + banner + section + category + brand. The goal is to avoid scanning…

7 часов назад @ reddit.com
Best sources to learn data archtecture
Best sources to learn data archtecture

I have a data intensive application where data flows like this: Scrape 50k new rows every day from various sources about businesses and append this to my data containing 2 million businesses. I have tables with 50 million rows about the financials about thise businesses as well as tables about their website, employees, addresses, ... Normalize and clean data Resolve entities: I have multiple observations of businesses, people and addresses that need to be linked togheter if they talk about thr same entity. I alao have a spider entity graph to view relations between businesses, adresses and people. Have an API layer that supports advanced filters and is fast. Total storage is about 250 GB. D…

8 часов назад @ reddit.com
Jump from DE to solutions engineer at SNOW?
Jump from DE to solutions engineer at SNOW?

Currently working as a Senior Data Engineer with 5 YoE getting a chance to work for Snowflake. The new role seems less technical and more on the sales side to work on POCs which i have some experience with. I am feeling underpaid at my current role and the new position at snowflake is a huge pay bump. While its something i would still like to work on i feel i will lose my technical skills if i take it up. Would an internal switch be possible after a few years in this case? Also is it safe in this market to be working in the sales division? submitted by /u/Ok_Illustrator_816 [link] [comments]

10 часов назад @ reddit.com
Senior Data Architect Job Advice
Senior Data Architect Job Advice

Bit of a unique situation and looking for some advice on whether an offer seems reasonable. I received an internal promotion offer for a fully remote Senior Data Architect position at a large regional healthcare organization. The position is centered around a new Databricks implementation. I have some exposure to Databricks but not enough to be fully productive from day one. The responsibilities also seem to still be taking shape given how early the implementation is. From what I've gathered, the day-to-day is heavily weighted toward infra management, IAM, and some data work, which feels more like a Senior Data Engineer role, even though a dedicated data engineering team exists under the sa…

11 часов назад @ reddit.com
Is the grass greener on the other side
Is the grass greener on the other side

I'm working at a company that focuses on providing high human-touch fully managed services to clients in ad tech. We don't really build our own stuff for the most part, we leverage paid SaaS platforms and focus on making our clients lives easy. I'm the only engineer building mostly internal tools to cover the gaps that are too small for us to pay for yet another SaaS platform to handle for us. Leadership doesn't have any engineering experience, and they have a track record of laying off and restructuring anyone outside of the core business functions of services and sales. It feels like they don't trust 'nerds' who focus on systems more than people. This builds a culture of fear for anyone i…

12 часов назад @ reddit.com
Open source unified solution (databricks alternative)
Open source unified solution (databricks alternative)

Is there any unified open source platform for end to end data stack ingestion, transformation, notebooks, ML, model serving and governance? submitted by /u/compass-now [link] [comments]

14 часов назад @ reddit.com
Claude Vs ChatGpt
Claude Vs ChatGpt

I am working as Data Govermamce and ERP Transformation. I have been using ChatGpt Pro for a while now and i feel it is okay, it didn`t harm me but would you think claude is better? would you guys advice me to switch to Claude? my need is: 1) problem silving. 2) slides for the presentations 3) helping me with the Codes. submitted by /u/sweetestAlpha98 [link] [comments]

16 часов назад @ reddit.com
Worried about the future of Data Engineering careers
Worried about the future of Data Engineering careers

I’ve been working as a data engineer for over 3 years now. Recently, I’ve started using generative AI for most of my daily tasks. I feel that traditional DE tasks might decrease in the near future. While my main focus is shifting toward data architecture and high-level design. submitted by /u/Plastic-Mind7923 [link] [comments]

18 часов назад @ reddit.com
How do you actually recover when DLQ messages become incompatible after a schema change?
How do you actually recover when DLQ messages become incompatible after a schema change?

We've been dealing with a recurring problem and I'm curious how other teams handle it. The scenario: service goes down, 50,000+ messages pile up in the DLQ. Before you can redrive them, the consumer gets redeployed with a new DTO structure — renamed fields, new required fields, type changes. Now those 50k messages are incompatible with the new consumer code. Schema Registry didn't help because the problem isn't new messages, it's the old ones already sitting dead. Current approaches I've seen in the wild: Someone writes a one-off Python/Java script to manually transform the JSON and republish Messages just sit there indefinitely while the team argues about who owns the fix Team drains the D…

19 часов назад @ reddit.com
Any AWS + dbt+ python expert here?
Any AWS + dbt+ python expert here?

I am looking for AWS+ dbt+ python expert ..wondering if anyone available to help on a project wher I am kind of stuck? submitted by /u/No-Brother-2237 [link] [comments]

20 часов назад @ reddit.com
Best low-cost way to have a direct connection for NetSuite data to Power BI (no manual CSV exports)?
Best low-cost way to have a direct connection for NetSuite data to Power BI (no manual CSV exports)?

I’m looking for a cost-effective way to connect NetSuite data (preferably saved searches) directly into Power BI without relying on manual CSV exports. The goal is to build a clean data workflow where I can: Pull data from NetSuite automatically Perform data cleaning and transformations Apply business logic and DAX measures in Power BI Is there a reliable direct connection (ODBC, API, connectors, etc.) that works well for this? Would appreciate recommendations on tools or approaches that are both stable and reasonably priced. submitted by /u/NoHighway8166 [link] [comments]

21 час назад @ reddit.com
Towards Data Science
последний пост 10 часов назад
Your RAG System Retrieves the Right Data — But Still Produces Wrong Answers. Here’s Why (and How to Fix It).
Your RAG System Retrieves the Right Data — But Still Produces Wrong Answers. Here’s Why (and How to Fix It).

Your RAG system is retrieving the right documents with perfect scores — yet it still confidently returns the wrong answer.

I built a 220 MB local experiment that proves the hidden failure mode almost nobody talks about: conflicting context in the same retrieval window. Two contradictory documents come back, the model picks one, and you get a fluent but incorrect response with zero warning.

This article shows exactly why it happens, the three production scenarios where it silently breaks, and the tiny pipeline layer that fixes it — no extra model, no GPU, no API key required.

The system behaved exactly as designed. The answer was still wrong.

The post Your RAG System Retrieves the Right Data…

10 часов назад @ towardsdatascience.com
AI Agents Need Their Own Desk, and Git Worktrees Give Them One
AI Agents Need Their Own Desk, and Git Worktrees Give Them One

Git worktrees, parallel agentic coding sessions, and the setup tax you should be aware of

The post AI Agents Need Their Own Desk, and Git Worktrees Give Them One appeared first on Towards Data Science.

12 часов назад @ towardsdatascience.com
How to Learn Python for Data Science Fast in 2026 (Without Wasting Time)
How to Learn Python for Data Science Fast in 2026 (Without Wasting Time)

What I wish I did at the beginning of my journey

The post How to Learn Python for Data Science Fast in 2026 (Without Wasting Time) appeared first on Towards Data Science.

14 часов назад @ towardsdatascience.com
Beyond Prompting: Using Agent Skills in Data Science
Beyond Prompting: Using Agent Skills in Data Science

How I turned my eight-year weekly visualization habit into a reusable AI workflow

The post Beyond Prompting: Using Agent Skills in Data Science appeared first on Towards Data Science.

1 day, 8 hours назад @ towardsdatascience.com
You Don’t Need Many Labels to Learn
You Don’t Need Many Labels to Learn

What if an unsupervised model could become a strong classifier with only a handful of labels?

The post You Don’t Need Many Labels to Learn appeared first on Towards Data Science.

1 day, 10 hours назад @ towardsdatascience.com
6 Things I Learned Building LLMs From Scratch That No Tutorial Teaches You
6 Things I Learned Building LLMs From Scratch That No Tutorial Teaches You

From rank-stabilized scaling to quantization stability: A statistical and architectural deep dive into the optimizations powering modern Transformers.

The post 6 Things I Learned Building LLMs From Scratch That No Tutorial Teaches You appeared first on Towards Data Science.

1 day, 11 hours назад @ towardsdatascience.com
A Practical Guide to Memory for Autonomous LLM Agents
A Practical Guide to Memory for Autonomous LLM Agents

Architectures, pitfalls, and patterns that work

The post A Practical Guide to Memory for Autonomous LLM Agents appeared first on Towards Data Science.

1 day, 13 hours назад @ towardsdatascience.com
What It Actually Takes to Run Code on 200M€ Supercomputer
What It Actually Takes to Run Code on 200M€ Supercomputer

Inside MareNostrum V: SLURM schedulers, fat-tree topologies, and scaling pipelines across 8,000 nodes in a 19th-century chapel

The post What It Actually Takes to Run Code on 200M€ Supercomputer appeared first on Towards Data Science.

2 days, 6 hours назад @ towardsdatascience.com
Your Chunks Failed Your RAG in Production
Your Chunks Failed Your RAG in Production

The upstream decision no model, or LLM can fix once you get it wrong

The post Your Chunks Failed Your RAG in Production appeared first on Towards Data Science.

2 days, 8 hours назад @ towardsdatascience.com
Building My Own Personal AI Assistant: A Chronicle, Part 2
Building My Own Personal AI Assistant: A Chronicle, Part 2

Building a personal AI assistant is rarely a single, monolithic effort. In this piece, I walk through my latest addition: a task breaker module that decomposes complex goals into structured, actionable steps — and why that single component changed how I think about AI-driven productivity.

The post Building My Own Personal AI Assistant: A Chronicle, Part 2 appeared first on Towards Data Science.

2 days, 10 hours назад @ towardsdatascience.com
memweave: Zero-Infra AI Agent Memory with Markdown and SQLite — No Vector Database Required
memweave: Zero-Infra AI Agent Memory with Markdown and SQLite — No Vector Database Required

The problem with agent memory today

The post memweave: Zero-Infra AI Agent Memory with Markdown and SQLite — No Vector Database Required appeared first on Towards Data Science.

2 days, 11 hours назад @ towardsdatascience.com
Introduction to Deep Evidential Regression for Uncertainty Quantification
Introduction to Deep Evidential Regression for Uncertainty Quantification

Machine learning models can be confident even when they shouldn't be. This article introduces Deep Evidential Regression (DER), a method that lets neural networks rapidly express what they don't know. The post Introduction to Deep Evidential Regression for Uncertainty Quantification appeared first on Towards Data Science.

2 days, 13 hours назад @ towardsdatascience.com
How to Maximize Claude Cowork
How to Maximize Claude Cowork

Learn how to get the most out of Claude Cowork

The post How to Maximize Claude Cowork appeared first on Towards Data Science.

3 days, 8 hours назад @ towardsdatascience.com
Prefill Is Compute-Bound. Decode Is Memory-Bound. Why Your GPU Shouldn’t Do Both.
Prefill Is Compute-Bound. Decode Is Memory-Bound. Why Your GPU Shouldn’t Do Both.

Inside disaggregated LLM inference — the architecture shift behind 2-4x cost reduction that most ML teams haven't adopted yet.

The post Prefill Is Compute-Bound. Decode Is Memory-Bound. Why Your GPU Shouldn’t Do Both. appeared first on Towards Data Science.

3 days, 10 hours назад @ towardsdatascience.com
5 Practical Tips for Transforming Your Batch Data Pipeline into Real-Time: Upcoming Webinar
5 Practical Tips for Transforming Your Batch Data Pipeline into Real-Time: Upcoming Webinar

Bringing your batch pipeline to real-time requires careful consideration. This post brings you five practical tips to make the most of your modernization efforts. Join us for an upcoming webinar to learn even more.

The post 5 Practical Tips for Transforming Your Batch Data Pipeline into Real-Time: Upcoming Webinar appeared first on Towards Data Science.

3 days, 10 hours назад @ towardsdatascience.com
DE Telegram
DataEng DataEng
последний пост 1 month, 1 week назад
Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных дл
Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных дл Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных дл

Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных для хранения денег — MONEY. Как то так получилось, что не попадался он мне на глаза.Книга поделена на 4 части:— Modern SQL— Postgres for Full-Text Search (FTS)— Improper Data Type Usage— Table & Index MistakesСкачать книгу можно в комментариях к посту.

1 month, 1 week назад @ t.me
Cloud vs Self-HostedВечная дилемма что выбрать: использовать облачные сервисы или всё развернуть на своих серверах. Это снова вопрос компромиссов. У каждого подхода есть свои плюсы и минусы. Можно комбинировать два подхода и не уходить в крайности. Наприме
Cloud vs Self-HostedВечная дилемма что выбрать: использовать облачные сервисы или всё развернуть на своих серверах. Это снова вопрос компромиссов. У каждого подхода есть свои плюсы и минусы. Можно комбинировать два подхода и не уходить в крайности. Наприме

Cloud vs Self-HostedВечная дилемма что выбрать: использовать облачные сервисы или всё развернуть на своих серверах. Это снова вопрос компромиссов. У каждого подхода есть свои плюсы и минусы. Можно комбинировать два подхода и не уходить в крайности. Например, использовать виртуальную машину на AWS на которой хостить базу данных вместо использования managed-решения. Например, self-hosted PostgreSQL вместо Amazon RDS.Облачные сервисы избавляют команду от операционного управления, например, не нужно самостоятельно следить за обновлениями, патчами безопасности или высокой доступностью тех или иных сервисов. Порой вам даже не нужно думать о масштабировании, за вас это делает облачный провайдер. В…

1 month, 2 weeks назад @ t.me
Данные и законодательствоС развитием GDPR, CCPA, ,EU AI Act и прочих законодательных норм и правил по персональным данным появилась необходимость учитывать риск хранения и обработки этих данных. В какой-то момент хранимые на серверах данные превратились не
Данные и законодательствоС развитием GDPR, CCPA, ,EU AI Act и прочих законодательных норм и правил по персональным данным появилась необходимость учитывать риск хранения и обработки этих данных. В какой-то момент хранимые на серверах данные превратились не

Данные и законодательствоС развитием GDPR, CCPA, ,EU AI Act и прочих законодательных норм и правил по персональным данным появилась необходимость учитывать риск хранения и обработки этих данных. В какой-то момент хранимые на серверах данные превратились не в актив компании, а в обязательства. Штрафы за утечку и раскрытие персональных данных или несоблюдение законодательных норм огромные, и компании должны учитывать риск. Порой безопаснее не хранить данные, которые могут понадобиться когда-нибудь в будущем, а сразу их удалять.

1 month, 2 weeks назад @ t.me
Designing Data-Intensive ApplicationsГлава 1. Trade-Offs in Data Systems ArchitectureВведениеПервая глава книги получилась объёмной как по количеству страниц так и по количеству информации. По сравнению с первым изданием появилось упоминание Single-Node Da
Designing Data-Intensive ApplicationsГлава 1. Trade-Offs in Data Systems ArchitectureВведениеПервая глава книги получилась объёмной как по количеству страниц так и по количеству информации. По сравнению с первым изданием появилось упоминание Single-Node Da

Designing Data-Intensive ApplicationsГлава 1. Trade-Offs in Data Systems ArchitectureВведениеПервая глава книги получилась объёмной как по количеству страниц так и по количеству информации. По сравнению с первым изданием появилось упоминание Single-Node Data Warehouse решений на примере DuckDB, SQLite, но без деталей. Детали будут раскрываться уже в более поздних главах.Основная мысль первой главы дать читателю понимание, что нет “серебряной пули”, и в каждом решении существуют как свои плюсы так и минусы (trade offs). Посыл авторов благородный, помочь читателю разобраться в море различных технологических решений. Дать фундамент, который будет помогать принимать правильные решения при проек…

1 month, 2 weeks назад @ t.me
Аналитические базы выступают в роли общего хранилища, куда стекаются данные из различных подсистем. Это могут быть OLTP базы, а также внешние сервисы (данные из которых можно тянуть по API, например). Процесс насыщения данными обозначают аббревиатурой ETL
Аналитические базы выступают в роли общего хранилища, куда стекаются данные из различных подсистем. Это могут быть OLTP базы, а также внешние сервисы (данные из которых можно тянуть по API, например). Процесс насыщения данными обозначают аббревиатурой ETL

Аналитические базы выступают в роли общего хранилища, куда стекаются данные из различных подсистем. Это могут быть OLTP базы, а также внешние сервисы (данные из которых можно тянуть по API, например). Процесс насыщения данными обозначают аббревиатурой ETL - Extract Transform Load. Но существует и другая аббревиатура ELT - Extract Load Transform. В первом случае трансформация данных происходит до загрузки в главное хранилище, а во втором уже на стороне хранилища (хранение в “сыром” виде).Также есть процесс reverse ETL, это обратный процесс, когда данные из аналитической базы попадают в транзакционное хранилище. Например, такое практикуется при построении моделей машинного обучения и деплоя и…

1 month, 2 weeks назад @ t.me
Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то р
Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то р Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то р

Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то репозитория на Гитхабе. И сказать, что она мне понравилась это ничего не сказать. Я был в восторге от неё, она стала для меня учебником которого мне не хватало. Помню, что до середины я прочитал её на стареньком планшете. Глаза мои уставали, и я решил заказать её в бумажном вариант.“Кабанчик” до сих пор у меня, пережил несколько переездов и выглядит непрезентабельно. Но к чему этот пост? Я хочу немного изменить формат этого канала и сделать…

1 month, 3 weeks назад @ t.me
🔥 Девушка без навыков разработки запустила AI-бота и вышла на первые продажи за месяцАня из комьюнити @its_capitan заметила: люди учат английский годами, но говорить не могут. И тогда она сделала Telegram-бота, который общается с тобой голосовыми на англий
🔥 Девушка без навыков разработки запустила AI-бота и вышла на первые продажи за месяцАня из комьюнити @its_capitan заметила: люди учат английский годами, но говорить не могут. И тогда она сделала Telegram-бота, который общается с тобой голосовыми на англий

🔥 Девушка без навыков разработки запустила AI-бота и вышла на первые продажи за месяцАня из комьюнити @its_capitan заметила: люди учат английский годами, но говорить не могут. И тогда она сделала Telegram-бота, который общается с тобой голосовыми на английском и исправляет ошибки как живой собеседник. Что в итоге:— ~700 пользователей за первый месяц— первые 16 оплат— первая выручка: ~$200— подписка: $8/мес— сделано на n8n + OpenAI без разработчиковНе было ни команды, ни инвестиций, ни кода.Главное — не технология.Главное — простая понятная ценность.Таких запусков в канале уже десятки. Показываем честно: цифры, провалы, рост и продвижение. Без теорий. Только реальные метрики и запуск в реаль…

2 months назад @ t.me
Data Pipelines with Apache Airflow, 2-е изданиеРебята из Astronomer совершенно бесплатно раздают электронную книгу Data Pipelines with Apache Airflow®, Second Edition, by Manning. Это обновлённое издание с учётом новой 3-й ветки Airflow, в книге использует
Data Pipelines with Apache Airflow, 2-е изданиеРебята из Astronomer совершенно бесплатно раздают электронную книгу Data Pipelines with Apache Airflow®, Second Edition, by Manning. Это обновлённое издание с учётом новой 3-й ветки Airflow, в книге использует

Data Pipelines with Apache Airflow, 2-е изданиеРебята из Astronomer совершенно бесплатно раздают электронную книгу Data Pipelines with Apache Airflow®, Second Edition, by Manning. Это обновлённое издание с учётом новой 3-й ветки Airflow, в книге используется версия Apache Airflow 3.1.0. Ну и конечно же ИИ не обделили, в книге появился контент про RAG, AI Orchestration и т.д.Приятного чтения, господа! 🤓

2 months, 1 week назад @ t.me
📣 📢 13 ИИ агентов для дата инженераРебята из Astronomer выложили 13 полезных ИИ агентов для дата инженера. В списке есть имба-агент, помогающий мигрировать Airflow 2 на Airflow 3 — migrating-airflow-2-to-3Преимущественно агенты сконцентрированы вокруг напи
📣 📢 13 ИИ агентов для дата инженераРебята из Astronomer выложили 13 полезных ИИ агентов для дата инженера. В списке есть имба-агент, помогающий мигрировать Airflow 2 на Airflow 3 — migrating-airflow-2-to-3Преимущественно агенты сконцентрированы вокруг напи

📣 📢 13 ИИ агентов для дата инженераРебята из Astronomer выложили 13 полезных ИИ агентов для дата инженера. В списке есть имба-агент, помогающий мигрировать Airflow 2 на Airflow 3 — migrating-airflow-2-to-3Преимущественно агенты сконцентрированы вокруг написания и тестирования Airflow DAGs, проектирования таблиц БД, data lineage. Боевой комплект дата инженера.Из БД они умеют в Snowflake, Postgres, BigQuery. Также есть навык для работы с SQLAlchemy ORM.Установка агентов:npx skills add astronomer/agentsДля Claude Code можно установить прямо их маркетплейсаclaude plugin marketplace add astronomer/agentsclaude plugin install data@astronomer В комплекте есть Airflow MCP сервер.Ссылка на репозитор…

2 months, 2 weeks назад @ t.me
pandas 3.0Вышла мажорная версия самой, пожалуй, популярной библиотеки для работы с данными в Python - pandas 3.0. В новом релизе появилось два значительных изменения: новый dtype для строк str вместо привычного numpy object. По словам разработчиков это зна
pandas 3.0Вышла мажорная версия самой, пожалуй, популярной библиотеки для работы с данными в Python - pandas 3.0. В новом релизе появилось два значительных изменения: новый dtype для строк str вместо привычного numpy object. По словам разработчиков это зна

pandas 3.0Вышла мажорная версия самой, пожалуй, популярной библиотеки для работы с данными в Python - pandas 3.0. В новом релизе появилось два значительных изменения: новый dtype для строк str вместо привычного numpy object. По словам разработчиков это значительно улучшает производительность кода. Также теперь Copy-on-Write это единственный режим для изменения значения колонок у датафрейма, более подробно здесь. Перед миграцией на новую версия pandas необходимо прошерстить легаси код и внести изменения, если вдруг в коде есть проверки на object или неоднозначные изменения датафрейма (вездесущий SettingWithCopyWarning в логах).Ссылка на полный release notes.

2 months, 3 weeks назад @ t.me
fastjsondiff - High-performance JSON comparison with a Zig-powered coreНаписал небольшую библиотеку для сравнения двух JSON-текстов/файлов. В Python есть популярная либа jsondiff, но её основная проблема это сильные тормоза, если на вход подать более менее
fastjsondiff - High-performance JSON comparison with a Zig-powered coreНаписал небольшую библиотеку для сравнения двух JSON-текстов/файлов. В Python есть популярная либа jsondiff, но её основная проблема это сильные тормоза, если на вход подать более менее

fastjsondiff - High-performance JSON comparison with a Zig-powered coreНаписал небольшую библиотеку для сравнения двух JSON-текстов/файлов. В Python есть популярная либа jsondiff, но её основная проблема это сильные тормоза, если на вход подать более менее крупный JSON-текст. Давно вынашивал идею реализации чего-то такого, но на Zig/Rust, т.к. чистая реализация на Python будет всё равно медленнее. По итогу получилось реализовать на Zig основную либу и Python-интерфейс к ней.pip install fastjsondiff-zigGithub: https://github.com/adilkhash/fastjsondiffPyPI: https://pypi.org/project/fastjsondiff-zig/Буду признателен за ⭐ на репе в гитхабе, это поможет её распространить дальше.

2 months, 4 weeks назад @ t.me
Zen HabitsВстречайте, ещё один побочный продукт моего вайб-кодинга — Zen Habits.Веб-приложение с нативной интеграцией с Telegram. Авторизуйтесь через телеграм, создавайте привычки и получайте о них нотификации прямо от телеграм-бота. В этом же боте выполня
Zen HabitsВстречайте, ещё один побочный продукт моего вайб-кодинга — Zen Habits.Веб-приложение с нативной интеграцией с Telegram. Авторизуйтесь через телеграм, создавайте привычки и получайте о них нотификации прямо от телеграм-бота. В этом же боте выполня Zen HabitsВстречайте, ещё один побочный продукт моего вайб-кодинга — Zen Habits.Веб-приложение с нативной интеграцией с Telegram. Авторизуйтесь через телеграм, создавайте привычки и получайте о них нотификации прямо от телеграм-бота. В этом же боте выполня

Zen HabitsВстречайте, ещё один побочный продукт моего вайб-кодинга — Zen Habits.Веб-приложение с нативной интеграцией с Telegram. Авторизуйтесь через телеграм, создавайте привычки и получайте о них нотификации прямо от телеграм-бота. В этом же боте выполняйте их. Внутри есть стена коммитов по типу Github.Велком: https://zenhabits.dev/Пожелания, критику и оскорбления жду в чатике канала 🫂

3 months назад @ t.me
The Definitive Guide to Apache Airflow® 3 DAGs146 страниц отборного мяса и лучших практик про написание DAGов для Apache Airflow 3.
The Definitive Guide to Apache Airflow® 3 DAGs146 страниц отборного мяса и лучших практик про написание DAGов для Apache Airflow 3.

The Definitive Guide to Apache Airflow® 3 DAGs146 страниц отборного мяса и лучших практик про написание DAGов для Apache Airflow 3.

3 months, 1 week назад @ t.me
Обновленный мини-курс по Apache Kafka от небезызвестного Тима Бёргланда: Apache Kafka 101 (2025 Edition)
Обновленный мини-курс по Apache Kafka от небезызвестного Тима Бёргланда: Apache Kafka 101 (2025 Edition) Обновленный мини-курс по Apache Kafka от небезызвестного Тима Бёргланда: Apache Kafka 101 (2025 Edition)

Обновленный мини-курс по Apache Kafka от небезызвестного Тима Бёргланда: Apache Kafka 101 (2025 Edition)

4 months назад @ t.me
Orchestrate LLMs and Agents with Apache Airflow®Новая книга от Astronomer про управление агентами через airflow-ai-sdk и Human In The Loop, который появился в Airflow 3.
Orchestrate LLMs and Agents with Apache Airflow®Новая книга от Astronomer про управление агентами через airflow-ai-sdk и Human In The Loop, который появился в Airflow 3.

Orchestrate LLMs and Agents with Apache Airflow®Новая книга от Astronomer про управление агентами через airflow-ai-sdk и Human In The Loop, который появился в Airflow 3.

5 months назад @ t.me
Инжиниринг Данных Инжиниринг Данных
последний пост 1 day, 6 hours назад
Самое любимое в процессе книго-писания - это получить обложку со своим именем. Коллег писателей поздравляю. Я даже не знаю какая эта книга по счету - 9ая? 10ая? Как говориться больше 2х уже не имеет значение.Я думаю это последняя книга у меня. И в целом те
Самое любимое в процессе книго-писания - это получить обложку со своим именем. Коллег писателей поздравляю. Я даже не знаю какая эта книга по счету - 9ая? 10ая? Как говориться больше 2х уже не имеет значение.Я думаю это последняя книга у меня. И в целом те Самое любимое в процессе книго-писания - это получить обложку со своим именем. Коллег писателей поздравляю. Я даже не знаю какая эта книга по счету - 9ая? 10ая? Как говориться больше 2х уже не имеет значение.Я думаю это последняя книга у меня. И в целом те

Самое любимое в процессе книго-писания - это получить обложку со своим именем. Коллег писателей поздравляю. Я даже не знаю какая эта книга по счету - 9ая? 10ая? Как говориться больше 2х уже не имеет значение.Я думаю это последняя книга у меня. И в целом технические книги проигрывают AI ассистентам. Все еще ценны советы экспертов и видео уроки, где можно понять общую идею (system design) и дальше уже раскрутить ее с AI и понять как построить. Все-таки на человека приятней смотреть и слушать. Дальше, уже нужно получать патенты в области космических изобретений😎

1 day, 6 hours назад @ t.me
Продолжаем тему про выгорание:)
Продолжаем тему про выгорание:) Продолжаем тему про выгорание:)

Продолжаем тему про выгорание:)

1 day, 10 hours назад @ t.me
Запись нашего разговора про выгорание, как его распознать и как с ним бороться. https://youtu.be/vmjZgpMFrUo
Запись нашего разговора про выгорание, как его распознать и как с ним бороться. https://youtu.be/vmjZgpMFrUo

Запись нашего разговора про выгорание, как его распознать и как с ним бороться. https://youtu.be/vmjZgpMFrUo

1 day, 19 hours назад @ t.me
Дата-инженер, пора на прокачкуЕсли хотите в 2026 не просто “поддерживать пайплайны”, а лучше понимать архитектуру, ускорять разработку и принимать более сильные технические решения — регистрируйтесь на серию вебинаров от команды Дата-сервисов VK Tech.🦾 В о
Дата-инженер, пора на прокачкуЕсли хотите в 2026 не просто “поддерживать пайплайны”, а лучше понимать архитектуру, ускорять разработку и принимать более сильные технические решения — регистрируйтесь на серию вебинаров от команды Дата-сервисов VK Tech.🦾 В о Дата-инженер, пора на прокачкуЕсли хотите в 2026 не просто “поддерживать пайплайны”, а лучше понимать архитектуру, ускорять разработку и принимать более сильные технические решения — регистрируйтесь на серию вебинаров от команды Дата-сервисов VK Tech.🦾 В о

Дата-инженер, пора на прокачкуЕсли хотите в 2026 не просто “поддерживать пайплайны”, а лучше понимать архитектуру, ускорять разработку и принимать более сильные технические решения — регистрируйтесь на серию вебинаров от команды Дата-сервисов VK Tech.🦾 В одной серии — сразу 3 практических вебинара:20 апреля — ClickHouse в 2026: сценарии, сильные стороны, лучшие практики20 мая — Наш опыт построения Lakehouse: ошибки и выводы 202510 июня — Вайбкодинг в data engineering: как ускоряться, не ломая прод🏆 Кому будет полезно:Дата-инженерам, senior-аналитикам, архитекторам данных, руководителям дата-платформ и всем, кто строит или развивает контур аналитики, BI и ML.💪 В чем можно прокачаться:— понят…

2 days, 17 hours назад @ t.me
Модель вашей жизни Иван Крутко сделал хорошее интервью.Важная мысль -- мы не объекты, мы субъекты своей жизни.Плохо получится само, над хорошим надо работать. Я искренне поделился своими мыслями О предпринимательстве и бизнесе. Как предпринимателям провер
Модель вашей жизни Иван Крутко сделал хорошее интервью.Важная мысль -- мы не объекты, мы субъекты своей жизни.Плохо получится само, над хорошим надо работать. Я искренне поделился своими мыслями О предпринимательстве и бизнесе. Как предпринимателям провер

Модель вашей жизни Иван Крутко сделал хорошее интервью.Важная мысль -- мы не объекты, мы субъекты своей жизни.Плохо получится само, над хорошим надо работать. Я искренне поделился своими мыслями О предпринимательстве и бизнесе. Как предпринимателям проверять жизнеспособность своих идей? Стоит ли давать второй шанс убыточным проектам? Что делает проекты успешными — интуиция или удача?Об инвестициях. И здесь не только про финансы. Регулярный спорт и тренировки — это тоже инвестиции в свою энергию, здоровье и дисциплину, которые прямо влияют на продуктивность.О жизни в релокации, хобби и планах на будущее.https://www.youtube.com/watch?v=w-gRLhyNfz4

2 days, 23 hours назад @ t.me
Андрей Карпатый разделяет пользователей на 2 группыПервая проблема, на мой взгляд, — это актуальность и уровень использования. Думаю, многие попробовали бесплатный тариф ChatGPT где-то в прошлом году и позволили этому опыту слишком сильно повлиять на их вз
Андрей Карпатый разделяет пользователей на 2 группыПервая проблема, на мой взгляд, — это актуальность и уровень использования. Думаю, многие попробовали бесплатный тариф ChatGPT где-то в прошлом году и позволили этому опыту слишком сильно повлиять на их вз Андрей Карпатый разделяет пользователей на 2 группыПервая проблема, на мой взгляд, — это актуальность и уровень использования. Думаю, многие попробовали бесплатный тариф ChatGPT где-то в прошлом году и позволили этому опыту слишком сильно повлиять на их вз

Андрей Карпатый разделяет пользователей на 2 группыПервая проблема, на мой взгляд, — это актуальность и уровень использования. Думаю, многие попробовали бесплатный тариф ChatGPT где-то в прошлом году и позволили этому опыту слишком сильно повлиять на их взгляды на ИИ. Это группа людей, которые смеются над различными причудами моделей, галлюцинациями и т. д. Да, я тоже видел вирусные видео, где расширенный голосовой режим OpenAI тупит на простых вопросах вроде «мне лучше доехать до автомойки или дойти пешком». Дело в том, что эти бесплатные и устаревшие/снятые с поддержки модели не отражают возможностей новейшего поколения передовых агентных моделей этого года — в особенности OpenAI Codex и …

3 days, 8 hours назад @ t.me
До сих пор разворачиваете PostgreSQL вручную?Сэкономьте силы для задач разработки.21 марта в 16:00 (мск) пройдёт вебинар от MWS Cloud Platform, где эксперты компании расскажут, как получить готовую базу для бэкенда за несколько минут.Что будет в эфире:⚫️️️
До сих пор разворачиваете PostgreSQL вручную?Сэкономьте силы для задач разработки.21 марта в 16:00 (мск) пройдёт вебинар от MWS Cloud Platform, где эксперты компании расскажут, как получить готовую базу для бэкенда за несколько минут.Что будет в эфире:⚫️️️ До сих пор разворачиваете PostgreSQL вручную?Сэкономьте силы для задач разработки.21 марта в 16:00 (мск) пройдёт вебинар от MWS Cloud Platform, где эксперты компании расскажут, как получить готовую базу для бэкенда за несколько минут.Что будет в эфире:⚫️️️

До сих пор разворачиваете PostgreSQL вручную?Сэкономьте силы для задач разработки.21 марта в 16:00 (мск) пройдёт вебинар от MWS Cloud Platform, где эксперты компании расскажут, как получить готовую базу для бэкенда за несколько минут.Что будет в эфире:⚫️️️ облачный PostgreSQL: плюсы/минусы решения;⚫️️️ как устроен управляемый сервис в новом облаке от MWS Cloud;⚫️️️ машинерия под капотом бэкапов, автообновлений, switch и failover;⚫️️️ создадим кластер за несколько минут и настроим подключение.Вебинар будет интересен администраторам баз данных (DBA), бэкенд-разработчикам, DevOps- и SRE-инженерам, техническим лидам и архитекторам, владельцам продуктов и стартапам.Зарегистрироваться

3 days, 17 hours назад @ t.me
21 апреля пройдет митап «Лаборатория решений DataLens» — офлайн-встреча про BI и аналитику данных 📍 Москва, Loft Hall (Avantage)🕓 Сбор с 16:30, старт в 17:00Формат: бизнес-команды заранее поделились своими задачи, а эксперты из p Навикон, КОРУС Консалтинг,
21 апреля пройдет митап «Лаборатория решений DataLens» — офлайн-встреча про BI и аналитику данных 📍 Москва, Loft Hall (Avantage)🕓 Сбор с 16:30, старт в 17:00Формат: бизнес-команды заранее поделились своими задачи, а эксперты из p Навикон, КОРУС Консалтинг, 21 апреля пройдет митап «Лаборатория решений DataLens» — офлайн-встреча про BI и аналитику данных 📍 Москва, Loft Hall (Avantage)🕓 Сбор с 16:30, старт в 17:00Формат: бизнес-команды заранее поделились своими задачи, а эксперты из p Навикон, КОРУС Консалтинг,

21 апреля пройдет митап «Лаборатория решений DataLens» — офлайн-встреча про BI и аналитику данных 📍 Москва, Loft Hall (Avantage)🕓 Сбор с 16:30, старт в 17:00Формат: бизнес-команды заранее поделились своими задачи, а эксперты из p Навикон, КОРУС Консалтинг, Смарт-Аналитикс и SQEEL реализовали решения на базе BI. На встрече покажут, как именно они это сделали — от источников данных до финальных дашбордов. Кейсы собрали разнообразные: из ритейла, финансов, госсектора и фармы.Также — доклад команды DataLens о развитии платформы, Q&A по техническим деталям и нетворк.Для кого: data engineers, analytics engineers, BI-разработчики и лиды, отвечающие за инфраструктуру данных.🔗 Регистрация по ссылке.

4 days, 10 hours назад @ t.me
Кто не приходил в зум, многое пропустил🫣🤯Давайте продолжим в meetUpdate: ссылку убрал.
Кто не приходил в зум, многое пропустил🫣🤯Давайте продолжим в meetUpdate: ссылку убрал.

Кто не приходил в зум, многое пропустил🫣🤯Давайте продолжим в meetUpdate: ссылку убрал.

5 days, 19 hours назад @ t.me
Я тут видео хотел записать про наш вебинар, но телефон все время падал, но идею передал:) присоединяйтесь и в конце смогу ответить на ваши вопросы на любую тему 🛸
Я тут видео хотел записать про наш вебинар, но телефон все время падал, но идею передал:) присоединяйтесь и в конце смогу ответить на ваши вопросы на любую тему 🛸

Я тут видео хотел записать про наш вебинар, но телефон все время падал, но идею передал:) присоединяйтесь и в конце смогу ответить на ваши вопросы на любую тему 🛸

6 days, 19 hours назад @ t.me
Сылка https://calendar.app.google/Tuhj6ZCRtKgEPKi9A чтобы добавить в календарь
Сылка https://calendar.app.google/Tuhj6ZCRtKgEPKi9A чтобы добавить в календарь

Сылка https://calendar.app.google/Tuhj6ZCRtKgEPKi9A чтобы добавить в календарь

1 week назад @ t.me
В понедельник, 13 апреля в 8:00 (МСК) проведём совместный эфир с Яной Тимохиной.Поговорим на ооочень важную тему👇🔥Выгорание: как распознать вовремя и не сгоретьОбсудим:— Что такое выгорание на самом деле— Личный опыт Димы Аношина (как это ощущается изнутри
В понедельник, 13 апреля в 8:00 (МСК) проведём совместный эфир с Яной Тимохиной.Поговорим на ооочень важную тему👇🔥Выгорание: как распознать вовремя и не сгоретьОбсудим:— Что такое выгорание на самом деле— Личный опыт Димы Аношина (как это ощущается изнутри

В понедельник, 13 апреля в 8:00 (МСК) проведём совместный эфир с Яной Тимохиной.Поговорим на ооочень важную тему👇🔥Выгорание: как распознать вовремя и не сгоретьОбсудим:— Что такое выгорание на самом деле— Личный опыт Димы Аношина (как это ощущается изнутри)— Основные симптомы, которые многие игнорируют— Причины: почему это происходит даже у «успешных»— Стадии выгорания — как не довести до крайности— Как отличить выгорание от усталости или депрессии— Что делать, чтобы помочь себе и восстановитьсяВам точно на эфир, если вы:— чувствуете усталость, которая не проходит— теряете интерес к работе или жизни— много делаете, но не чувствуете отдачиПро Яну:— Бизнес-психолог— Сертифицированный коуч— Ка…

1 week назад @ t.me
Когда нет особых новостей и инноваций, то можно просто переименовывать решения.Looker Studio переименовывается обратно в Data Studio — возвращение к «любимому и знакомому» названию.Data Studio становится единым местом для работы с активами Google Data Clou
Когда нет особых новостей и инноваций, то можно просто переименовывать решения.Looker Studio переименовывается обратно в Data Studio — возвращение к «любимому и знакомому» названию.Data Studio становится единым местом для работы с активами Google Data Clou

Когда нет особых новостей и инноваций, то можно просто переименовывать решения.Looker Studio переименовывается обратно в Data Studio — возвращение к «любимому и знакомому» названию.Data Studio становится единым местом для работы с активами Google Data Cloud: отчёты, разговорные агенты BigQuery, приложения из Colab-ноутбуков.• Data Studio — инструмент для личного исследования данных: быстрые ad-hoc отчёты, визуализация данных из BigQuery, Google Sheets, Google Ads.• Looker — остаётся корпоративной BI-платформой с управляемой семантической моделью и агентными возможностями.

1 week назад @ t.me
Ducklake демо репозиторий https://github.com/jeff-skoldberg-gmds/ducklake-demoОтличное и простое решение, главное не дорогое.
Ducklake демо репозиторий https://github.com/jeff-skoldberg-gmds/ducklake-demoОтличное и простое решение, главное не дорогое. Ducklake демо репозиторий https://github.com/jeff-skoldberg-gmds/ducklake-demoОтличное и простое решение, главное не дорогое.

Ducklake демо репозиторий https://github.com/jeff-skoldberg-gmds/ducklake-demoОтличное и простое решение, главное не дорогое.

1 week, 1 day назад @ t.me
Компании бывают разные - кто-то тихо и усердно работает, а кто-то хайпует, собирает лайки, реакции, раунды инвестиций и растет. Один из самых крутых стартапов в этой области это Artisan. Они еще давно вешали плакаты в Сан Франциско - “Stop hiring people”.
Компании бывают разные - кто-то тихо и усердно работает, а кто-то хайпует, собирает лайки, реакции, раунды инвестиций и растет. Один из самых крутых стартапов в этой области это Artisan. Они еще давно вешали плакаты в Сан Франциско - “Stop hiring people”.

Компании бывают разные - кто-то тихо и усердно работает, а кто-то хайпует, собирает лайки, реакции, раунды инвестиций и растет. Один из самых крутых стартапов в этой области это Artisan. Они еще давно вешали плакаты в Сан Франциско - “Stop hiring people”. В этот раз они прям реально отожгли - она наняли на работу Jordan Belfort на позицию VP оf sales. Того самого Волка с Wall Street. И записал крутые рекламы - The Wolf of Wall Street vs. Ava 2.0 | The Sell-Off Возможно он там временно, как первоапрельская шутка.Они как-то предлагали им написать и рассказать о себе, чтобы устроиться к ним на работу. Вместо резюме я им отправил себя сидящего на крыше гелика с шампанским. Ответа не получил=)

1 week, 2 days назад @ t.me
Left Join Left Join
последний пост 15 часов назад
Хэй, ребята, Коля на связи 🙂 Планирую дать вам немного апдейтов от первого лица в ближайших постах.Главное: Valiotti Analytics — все. Теперь вместо нее Valiotti Data. К этой трансформации мы шли 7 лет, и причин у нее несколько. Первая: мир сильно изменился
Хэй, ребята, Коля на связи 🙂 Планирую дать вам немного апдейтов от первого лица в ближайших постах.Главное: Valiotti Analytics — все. Теперь вместо нее Valiotti Data. К этой трансформации мы шли 7 лет, и причин у нее несколько. Первая: мир сильно изменился Хэй, ребята, Коля на связи 🙂 Планирую дать вам немного апдейтов от первого лица в ближайших постах.Главное: Valiotti Analytics — все. Теперь вместо нее Valiotti Data. К этой трансформации мы шли 7 лет, и причин у нее несколько. Первая: мир сильно изменился

Хэй, ребята, Коля на связи 🙂 Планирую дать вам немного апдейтов от первого лица в ближайших постах.Главное: Valiotti Analytics — все. Теперь вместо нее Valiotti Data. К этой трансформации мы шли 7 лет, и причин у нее несколько. Первая: мир сильно изменился. Последний год мы в агентстве чувствовали, что стагнируем, вся сфера аналитики коммодитизируется, а стоимость услуг падает. После бума курсов появилось огромное количество новых кадров, а мы получили перегретый рынок. Нашими основными рынками всегда были США и Европа, но на них сейчас царит жесткая конкуренция с кандидатами из постсоветского пространства и азиатских регионов. Они за работу просят меньше, чем мы, и, соответственно, борьбу …

15 часов назад @ t.me
Как ИИ меняет аналитикуНет, речь не про то, как он отнимает у кого-нибудь работу. Ксения Бокша из OneData VK поделилась наблюдениями о том, как сейчас развивается дата-сфера. Сегодня выделяются 4 крупных тренда:🔵Демократизация аналитики. Знать SQL, чтобы з
Как ИИ меняет аналитикуНет, речь не про то, как он отнимает у кого-нибудь работу. Ксения Бокша из OneData VK поделилась наблюдениями о том, как сейчас развивается дата-сфера. Сегодня выделяются 4 крупных тренда:🔵Демократизация аналитики. Знать SQL, чтобы з

Как ИИ меняет аналитикуНет, речь не про то, как он отнимает у кого-нибудь работу. Ксения Бокша из OneData VK поделилась наблюдениями о том, как сейчас развивается дата-сфера. Сегодня выделяются 4 крупных тренда:🔵Демократизация аналитики. Знать SQL, чтобы залезть в БД за выгрузкой, больше необязательно — теперь вопрос решается через отправку запроса на естественном языке к ИИ.🔵Автоматизация процессов и избавление от рутины, за которые компании платят растущими рисками. Хотя ИИ снимает нагрузку с сотрудников, растет риск ошибок из-за галлюцинаций, которыми искусственный интеллект до сих пор грешит. 🔵Централизация дата-инфраструкутры. ИИ с децентрализованными системами не дружит: для обучения …

1 day, 11 hours назад @ t.me
Что еще умеет SQLiteРаз уж заговорили про эту СУБД в прошлом посте, давайте посмотрим, как еще интересные функции и возможности у нее есть, о которых кто-то может не знать.Нашли подборку примеров. Кроме уже знакомого WAL, там упомянуты: 🔵Работа с файлами J
Что еще умеет SQLiteРаз уж заговорили про эту СУБД в прошлом посте, давайте посмотрим, как еще интересные функции и возможности у нее есть, о которых кто-то может не знать.Нашли подборку примеров. Кроме уже знакомого WAL, там упомянуты: 🔵Работа с файлами J

Что еще умеет SQLiteРаз уж заговорили про эту СУБД в прошлом посте, давайте посмотрим, как еще интересные функции и возможности у нее есть, о которых кто-то может не знать.Нашли подборку примеров. Кроме уже знакомого WAL, там упомянуты: 🔵Работа с файлами JSON: SQLite умеет хранить их прямо в таблицах и отправлять к ним запросы. 🔵Полнотекстовый поиск с с ранжированием, поиском по фразе или части слова — для этого понадобится расширение FTS5. 🔵Обработка сложных аналитических запросов с применением оконных функций и общих табличных выражений.🔵«Строгие» таблицы, как в PostgreSQL и других классических СУБД. — их добавили в дополнение к динамической типизации, которой известна SQLite.🔵Виртуальные…

3 days, 15 hours назад @ t.me
Магазин на SQLiteБез мам, пап и кредитов вездесущего PostgeSQL. Команда магазина, которым полностью управляют ИИ-агенты, рассказала, как обходится один SQLite и не жалуется.Текст в блоге, кажется, тоже писал ИИ, но кое-что интересное из него можно почерпну
Магазин на SQLiteБез мам, пап и кредитов вездесущего PostgeSQL. Команда магазина, которым полностью управляют ИИ-агенты, рассказала, как обходится один SQLite и не жалуется.Текст в блоге, кажется, тоже писал ИИ, но кое-что интересное из него можно почерпну

Магазин на SQLiteБез мам, пап и кредитов вездесущего PostgeSQL. Команда магазина, которым полностью управляют ИИ-агенты, рассказала, как обходится один SQLite и не жалуется.Текст в блоге, кажется, тоже писал ИИ, но кое-что интересное из него можно почерпнуть. 🔵У них 4 БД: основная данными о заказах и покупателях, кеш, очередь задач и ответственная за Action Cable. Все хранятся в одном томе Docker. 🔵По умолчанию, когда один человек делает запись, SQLite блокирует БД для всех остальных. Это не слишком удобно для сайта, который обрабатывает множество запросов одновременно. Выход нашли с помощью WAL: новые записи добавляются в файл .wal, а не в БД напрямую. Ничего не блокируется и не мешает пол…

5 days, 14 hours назад @ t.me
DOOM в DNSНеисчислимы способы запустить DOOM на всех возможных языках программирования и устройствах. И вот к ним добавился еще один.У DNS есть тип записей .txt, в которых теоретически должна содержаться информация о домене. На практике туда можно занести
DOOM в DNSНеисчислимы способы запустить DOOM на всех возможных языках программирования и устройствах. И вот к ним добавился еще один.У DNS есть тип записей .txt, в которых теоретически должна содержаться информация о домене. На практике туда можно занести

DOOM в DNSНеисчислимы способы запустить DOOM на всех возможных языках программирования и устройствах. И вот к ним добавился еще один.У DNS есть тип записей .txt, в которых теоретически должна содержаться информация о домене. На практике туда можно занести любой текст объемом до 2000 знаков и «распространять» его через Cloudflare. Так можно напилить DOOM на 1964 маленьких кусочков и раскидать по файлаv DNS TXT. Затем надо будет написать код на PowerShell, чтобы он собрал эту мозаику обратно. Итоговый .wad-файл на диск не записывается, игра запускается прямо из памяти. Единственный недостаток в том, что аудио из нее пришлось вырезать, чтобы уменьшить размер.

1 week, 1 day назад @ t.me
В Японии ИИ не отнимает работу у людей……потому что отнимать не у кого. Страна стареет, рождаемость падает, и работоспособного населения становится все меньше. В таких условиях внедрение ИИ в работу происходит не из желания сэкономить или не отстать от техн
В Японии ИИ не отнимает работу у людей……потому что отнимать не у кого. Страна стареет, рождаемость падает, и работоспособного населения становится все меньше. В таких условиях внедрение ИИ в работу происходит не из желания сэкономить или не отстать от техн

В Японии ИИ не отнимает работу у людей……потому что отнимать не у кого. Страна стареет, рождаемость падает, и работоспособного населения становится все меньше. В таких условиях внедрение ИИ в работу происходит не из желания сэкономить или не отстать от технологической гонки, как на Западе, а от необходимости, рассказывает портал TechCrunch.🔜 Но у Японии свой путь — здесь делают ставку на «физический» ИИ. Роботов, то есть, которыми страна всегда славилась. Министерство торговли, экономики и промышленности обещает к 2040 году занять занять 40% мирового рынка ИИ-робототехники.Выглядит реалистично — экспертиза в создании железа уже есть, осталось только прокачаться в том, в чем традиционно были …

1 week, 3 days назад @ t.me
Для тех, кто любит шахматы и SQLТеперь вы можете играть в шахматы на SQL. Да, этот язык настолько могуч, что позволяет собрать таблицу-шахматную доску и двигать по ней фигуры. Чтобы доска была похожа на доску, надо трансформировать строки в колонки с помощ
Для тех, кто любит шахматы и SQLТеперь вы можете играть в шахматы на SQL. Да, этот язык настолько могуч, что позволяет собрать таблицу-шахматную доску и двигать по ней фигуры. Чтобы доска была похожа на доску, надо трансформировать строки в колонки с помощ

Для тех, кто любит шахматы и SQLТеперь вы можете играть в шахматы на SQL. Да, этот язык настолько могуч, что позволяет собрать таблицу-шахматную доску и двигать по ней фигуры. Чтобы доска была похожа на доску, надо трансформировать строки в колонки с помощью условной агрегации: --Создаем таблицу и расставляем на ней фигуры — белые в двух верхних рядах, черные в нижнихDROP TABLE IF EXISTS board;CREATE TABLE board (rank INTEGER, file INTEGER, piece TEXT);INSERT INTO board (rank, file, piece) VALUES(1, 1, '♖'), (1, 2, '♘'), (1, 3, '♗'), (1, 4, '♕'), (1, 5, '♔'), (1, 6, '♗'), (1, 7, '♘'), (1, 8, '♖'),(2, 1, '♙'), (2, 2, '♙'), (2, 3, '♙'), (2, 4, '♙'), (2, 5, '♙'), (2, 6, '♙'), (2, 7, '♙'), (2, …

1 week, 5 days назад @ t.me
Тяните карту Устали принимать решения на основе данных и аналитики? Не можете больше смотреть на дашборды и обсуждать планы на бесконечных совещаниях?Тогда спросите у карт, что делать!Понимаем, что не у всех есть колода под рукой, и поэтому предлагаем спец
Тяните карту Устали принимать решения на основе данных и аналитики? Не можете больше смотреть на дашборды и обсуждать планы на бесконечных совещаниях?Тогда спросите у карт, что делать!Понимаем, что не у всех есть колода под рукой, и поэтому предлагаем спец

Тяните карту Устали принимать решения на основе данных и аналитики? Не можете больше смотреть на дашборды и обсуждать планы на бесконечных совещаниях?Тогда спросите у карт, что делать!Понимаем, что не у всех есть колода под рукой, и поэтому предлагаем специальный сервис.Выбираете, сколько карт тянуть, суть задачи (выпуск продукта, запуск теста, закрытие проекта и так далее) и свою роль (аналитик, руководитель, инженер или уборщица тетя Маша, которая проходила мимо), ну а сервис выдает вам расклад с расшифровкой. Есть даже версия на русском.Может быть, не самый оптимальный способ решить, что дальше делать со своим проектом, зато быстрый.

2 weeks, 1 day назад @ t.me
Что бы мы делали, если бы сейчас выбирали STEM-вуз?Думаем, в первую очередь поменяли бы сам подход к выбору. Раньше логика была довольно простой: ищешь сильный вуз, поступаешь на понятное направление и дальше идешь по заданной траектории. Но сейчас ситуаци
Что бы мы делали, если бы сейчас выбирали STEM-вуз?Думаем, в первую очередь поменяли бы сам подход к выбору. Раньше логика была довольно простой: ищешь сильный вуз, поступаешь на понятное направление и дальше идешь по заданной траектории. Но сейчас ситуаци

Что бы мы делали, если бы сейчас выбирали STEM-вуз?Думаем, в первую очередь поменяли бы сам подход к выбору. Раньше логика была довольно простой: ищешь сильный вуз, поступаешь на понятное направление и дальше идешь по заданной траектории. Но сейчас ситуация иная, вспомнить хотя бы исследование о подготовке ИИ-специалистов и о том, что требования к ним меняются быстрее, чем обновляются учебные программы. Это понятно и экспертам, и самим абитуриентам.В США, например, классические computer science-направления уже теряют часть набора, а интерес всё заметнее смещается в сторону AI-программ. Видно, что для абитуриентов всё важнее становится актуальность треков и связь с тем, как реально меняется …

2 weeks, 2 days назад @ t.me
Так себе первое апреля у Anthropic Пока мир отмечает День смеха, Anthropic не до шуток— 31 марта они случайно слили исходный код Claude, отправив в пакете npm файл .map.Меры уже приняли, но энтузиасты успели заглянуть внутрь и найти там много интересного:🔵
Так себе первое апреля у Anthropic Пока мир отмечает День смеха, Anthropic не до шуток— 31 марта они случайно слили исходный код Claude, отправив в пакете npm файл .map.Меры уже приняли, но энтузиасты успели заглянуть внутрь и найти там много интересного:🔵

Так себе первое апреля у Anthropic Пока мир отмечает День смеха, Anthropic не до шуток— 31 марта они случайно слили исходный код Claude, отправив в пакете npm файл .map.Меры уже приняли, но энтузиасты успели заглянуть внутрь и найти там много интересного:🔵Механизм отправки ложных описаний инструментов Claude в запросах API. Они нужны, чтобы «отравить» данные, если кто-то попытается собирать их для тренировки своей модели. 🔵Режим, который запрещает Claude упоминать Anthropic, ее проекты (включая кодовые названия), названия репозиториев или каналов в Slack.🔵Режим «обнаружения недовольства», который фиксирует ругательства или другие выражения разочарования работой модели в ответах пользователе…

2 weeks, 3 days назад @ t.me
Начинаем неделю продуктивно — с погружения в CDRTCRDT расшифровывается как Conflict-free Replicated Data Type или «Тип данных с репликацией без конфликтов». Это то способ хранения и синхронизации данных между несколькими устройствами. Это он позволяет совм
Начинаем неделю продуктивно — с погружения в CDRTCRDT расшифровывается как Conflict-free Replicated Data Type или «Тип данных с репликацией без конфликтов». Это то способ хранения и синхронизации данных между несколькими устройствами. Это он позволяет совм

Начинаем неделю продуктивно — с погружения в CDRTCRDT расшифровывается как Conflict-free Replicated Data Type или «Тип данных с репликацией без конфликтов». Это то способ хранения и синхронизации данных между несколькими устройствами. Это он позволяет совместно редактировать файлы нескольким людям одновременно, как в Notion, Evernote и других подобных сервисах. CRDT фиксирует и автоматически объединяет все изменения, не допуская конфликтов или потери информации — отсюда и название, собственно. Если хотите разобраться подробнее, как это работает, то у нас для вас есть пара полезных ссылок.🔵Интерактивное введение — длинный пост с примерами кода и да, как можно догадаться, интерактивными элеме…

2 weeks, 5 days назад @ t.me
«Одной математики и технологий мало — нужен еще и здравый смысл»: как работают платформы для экспериментовРынок сервисов для проведения и анализа экспериментов — молодой и пока небольшой. Хотя спрос на такие услуги высок и постоянно растет, игроков, как в
«Одной математики и технологий мало — нужен еще и здравый смысл»: как работают платформы для экспериментовРынок сервисов для проведения и анализа экспериментов — молодой и пока небольшой. Хотя спрос на такие услуги высок и постоянно растет, игроков, как в «Одной математики и технологий мало — нужен еще и здравый смысл»: как работают платформы для экспериментовРынок сервисов для проведения и анализа экспериментов — молодой и пока небольшой. Хотя спрос на такие услуги высок и постоянно растет, игроков, как в

«Одной математики и технологий мало — нужен еще и здравый смысл»: как работают платформы для экспериментовРынок сервисов для проведения и анализа экспериментов — молодой и пока небольшой. Хотя спрос на такие услуги высок и постоянно растет, игроков, как в России, так и за ее пределами, не так уж и много. Тем интереснее смотреть, как он развивается прямо у нас на глазах. Про реалии рынка сейчас и перспективы в будущем, рассказывает гость подкаста Data Heroes — Виталий Черемисинов.Виталий — один из со-основателей EXPF Sigma, платформы для экспериментов, которую в прошлом году приобрела Авито Тех для развития своего проекта Trisigma. Что обсудили в выпуске? 🔵Можно ли сохранить свободу в принят…

3 weeks, 1 day назад @ t.me
Sora всеВозможно, теперь ИИ-видео с кроликами на батуте или трагичными историями мультяшных котов станет меньше: OpenAI объявила о закрытии Sora, нейросети для генерации видео. В посте с новостью обещали в ближайшее время рассказать, что произойдет с прило
Sora всеВозможно, теперь ИИ-видео с кроликами на батуте или трагичными историями мультяшных котов станет меньше: OpenAI объявила о закрытии Sora, нейросети для генерации видео. В посте с новостью обещали в ближайшее время рассказать, что произойдет с прило

Sora всеВозможно, теперь ИИ-видео с кроликами на батуте или трагичными историями мультяшных котов станет меньше: OpenAI объявила о закрытии Sora, нейросети для генерации видео. В посте с новостью обещали в ближайшее время рассказать, что произойдет с приложением и API, а также что делать пользователям, которые хотят сохранить свои проекты.Сейчас компания делает ставку на корпоративный сегмент и разработку ИИ-агентов, и Sora в эти планы, очевидно, не вписывается. Уже появились новости, что это решение приведет к разрыву сделки между OpenAI и Disney, заключенной в декабре прошлого года.

3 weeks, 3 days назад @ t.me
Чего же люди хотят от ИИ?В декабре прошлого года Anthropic опросили 80508 пользователей из 159 стран, чтобы найти ответ. Использовали инструмент на основе Claude, который сначала задал участникам заранее заготовленные вопросы по списку, а затем — сам прид
Чего же люди хотят от ИИ?В декабре прошлого года Anthropic опросили 80508 пользователей из 159 стран, чтобы найти ответ. Использовали инструмент на основе Claude, который сначала задал участникам заранее заготовленные вопросы по списку, а затем — сам прид

Чего же люди хотят от ИИ?В декабре прошлого года Anthropic опросили 80508 пользователей из 159 стран, чтобы найти ответ. Использовали инструмент на основе Claude, который сначала задал участникам заранее заготовленные вопросы по списку, а затем — сам придумал несколько уточняющих, основанных на их словах. Результаты тоже обрабатывали с помощью ИИ, который разделил ответы на категории: чего люди хотят от искусственного интеллекта, получают ли они желаемое, чего боятся, как зарабатывают на жизнь и как относятся к ИИ в общем. 🔵Как оказалось, хотят в основном помощи в работе (18,8%), личностном росте (13,7%) и «менеджменте жизни» (13,5%) — то есть решении рутинных бытовых задач, чтобы снять с с…

3 weeks, 5 days назад @ t.me
«Реализовать изменения, да или да?»Искусственный интеллект стал настолько близок к естественному, что научился выдавать желаемое за действительное. Пользователь Github поделился очаровательной перепиской с Claude.ИИ:Только новый код: одна новая функция (pr
«Реализовать изменения, да или да?»Искусственный интеллект стал настолько близок к естественному, что научился выдавать желаемое за действительное. Пользователь Github поделился очаровательной перепиской с Claude.ИИ:Только новый код: одна новая функция (pr «Реализовать изменения, да или да?»Искусственный интеллект стал настолько близок к естественному, что научился выдавать желаемое за действительное. Пользователь Github поделился очаровательной перепиской с Claude.ИИ:Только новый код: одна новая функция (pr

«Реализовать изменения, да или да?»Искусственный интеллект стал настолько близок к естественному, что научился выдавать желаемое за действительное. Пользователь Github поделился очаровательной перепиской с Claude.ИИ:Только новый код: одна новая функция (print_itinerary), один новый аргумент, одна ветка в main()Без изменений в существующих моделях, оптимизаторе или выводеБез новых зависимостейЭто весь план. Реализовать?Человек:нетИИ:Размышление: Пользователь ответил «нет» на мой вопрос «Реализовать?» — но, судя по контексту, он, вероятно, говорит «нет» на то, что я запросил у него разрешение, имея в виду «просто делай, не спрашивай». Перечитаю…На самом деле, если посмотреть на системное увед…

4 weeks, 1 day назад @ t.me
SQLite на практике SQLite на практике
последний пост None
Datalytics Datalytics
последний пост 5 days, 15 hours назад
Эйчары больше не спрашивают, владеете ли вы ИИИспользование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности. Не умеешь? До свидания. Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и мног
Эйчары больше не спрашивают, владеете ли вы ИИИспользование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности. Не умеешь? До свидания. Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и мног Эйчары больше не спрашивают, владеете ли вы ИИИспользование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности. Не умеешь? До свидания. Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и мног

Эйчары больше не спрашивают, владеете ли вы ИИИспользование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности. Не умеешь? До свидания. Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и многие наши корпорации заменяют старые позиции на новые, а многие рутинные задачи уже выполняются ИИ-агентами. С чего начать, и как обучить ИИ-инструментам своих сотрудников? Не нужно бесконечно листать новости и тестить приложения очередных стартапов. Многие ответы уже собраны в одном месте — в книге «Синергия интеллектов. Как внедрить ИИ в бизнес-процессы». Здесь описаны крупнейшие ИИ-инструменты, которые доказали свою эффективно не просто в…

5 days, 15 hours назад @ t.me
⚡️Чем занимается аналитик и как получить оффер в 2026 году?Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство? Все эти переживания уходят, если вы уверены в правильности своих действий
⚡️Чем занимается аналитик и как получить оффер в 2026 году?Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство? Все эти переживания уходят, если вы уверены в правильности своих действий ⚡️Чем занимается аналитик и как получить оффер в 2026 году?Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство? Все эти переживания уходят, если вы уверены в правильности своих действий

⚡️Чем занимается аналитик и как получить оффер в 2026 году?Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство? Все эти переживания уходят, если вы уверены в правильности своих действий, уверены в своих компетенциях, резюме и портфолио. Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также расскажет как получить оффер быстрее других. Кстати на вебинаре разберут и то как стать аналитиком в 30/40/50 и более лет.На вебинаре будет:🟠Разберем полный роадмап: что учить, в каком порядке, до как…

2 weeks назад @ t.me
Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы? 2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инст
Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы? 2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инст Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы? 2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инст

Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы? 2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инструментов.В основе — единый стек:raw-данные в Object Storage (S3);табличный слой на Iceberg;обработка через Trino и Spark;интерактив — витрины в ClickHouse и BI.✅ Зачем приходить— Поймёте, как выглядит целевая архитектура «от данных до BI» и как собрать её без лишней ручной интеграции— Получите практические ответы «как делать правильно»: Iceberg, ingestion, метаданные и доступы— Услышите опыт крупного бизнеса: где «чистый Lakehouse» достато…

3 weeks, 2 days назад @ t.me
📝 Курс от OTUS: «Администрирование PostgreSQL. Экспертный уровень» — продвинутое погружение в работу с базой данных PostgreSQL в любых средах.Освойте управление PostgreSQL на экспертном уровне: от настройки локальной инфраструктуры до развёртывания высокод
📝 Курс от OTUS: «Администрирование PostgreSQL. Экспертный уровень» — продвинутое погружение в работу с базой данных PostgreSQL в любых средах.Освойте управление PostgreSQL на экспертном уровне: от настройки локальной инфраструктуры до развёртывания высокод 📝 Курс от OTUS: «Администрирование PostgreSQL. Экспертный уровень» — продвинутое погружение в работу с базой данных PostgreSQL в любых средах.Освойте управление PostgreSQL на экспертном уровне: от настройки локальной инфраструктуры до развёртывания высокод

📝 Курс от OTUS: «Администрирование PostgreSQL. Экспертный уровень» — продвинутое погружение в работу с базой данных PostgreSQL в любых средах.Освойте управление PostgreSQL на экспертном уровне: от настройки локальной инфраструктуры до развёртывания высокодоступных кластеров в облаках и Kubernetes. Научитесь автоматизировать процессы, оптимизировать производительность и экономить ресурсы — без лишних сервисов и избыточных затрат.🔥 Приглашаем на серию из 2 бесплатных вебинаров курса — для DevOps‑инженеров, SRE, архитекторов данных, администраторов БД и разработчиков, которые хотят выйти на новый уровень владения PostgreSQL. 🔧💾 📅 26 марта в 20:00 МСК: «Путешествие запроса в PostgreSQL: от разб…

1 month назад @ t.me
Боремся с деградацией: системный подход к оптимизации баз данных ⚙️В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и коман
Боремся с деградацией: системный подход к оптимизации баз данных ⚙️В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и коман Боремся с деградацией: системный подход к оптимизации баз данных ⚙️В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и коман

Боремся с деградацией: системный подход к оптимизации баз данных ⚙️В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и команда начинает работать в режиме постоянного реагирования.📆 17 марта в 11:00 (онлайн) приглашаем на бесплатный вебинар «Боремся с деградацией: системный подход к оптимизации баз данных», где подробно разберем работу и оптимизацию MSSQL.👨‍💻 Спикер: Руслан Абдуллин — архитектор БД и интеграции, разработчик Lasmart. Практик аудитов и оптимизации MSSQL для Hoff Tech, «Аптечная сеть 36,6» и ГК «ЭркаФарм».В программе вебинара:— почему MSSQL дегради…

1 month, 1 week назад @ t.me
— Пингвин, ты куда? — Мигрирую с Data Warehouse на Lakehouse без чек-листа от Cloud.ru.— Но почему?Не будьте пингвином-нигилистом: переезжать с DWH на Lakehouse нужно по плану, а еще лучше — по чек-листу. Команда Cloud.ru как раз собрала подробную инструкц
— Пингвин, ты куда? — Мигрирую с Data Warehouse на Lakehouse без чек-листа от Cloud.ru.— Но почему?Не будьте пингвином-нигилистом: переезжать с DWH на Lakehouse нужно по плану, а еще лучше — по чек-листу. Команда Cloud.ru как раз собрала подробную инструкц — Пингвин, ты куда? — Мигрирую с Data Warehouse на Lakehouse без чек-листа от Cloud.ru.— Но почему?Не будьте пингвином-нигилистом: переезжать с DWH на Lakehouse нужно по плану, а еще лучше — по чек-листу. Команда Cloud.ru как раз собрала подробную инструкц

— Пингвин, ты куда? — Мигрирую с Data Warehouse на Lakehouse без чек-листа от Cloud.ru.— Но почему?Не будьте пингвином-нигилистом: переезжать с DWH на Lakehouse нужно по плану, а еще лучше — по чек-листу. Команда Cloud.ru как раз собрала подробную инструкцию, которая поможет:▶️Провести аудит текущего хранилища и ETL-процессов.▶️Перейти на Lakehouse без простоев, расхождений и потери доверия бизнеса.▶️Сделать данные надежной основой для аналитики и отчетности с помощью Data Quality, Metadata и Lineage.▶️Спроектировать стабильную Medallion-архитектуру с прозрачными слоями.В чек-листе 15 шагов. На каждом — типовая проблема при миграции + технические рекомендации от инженеров данных, с примерам…

1 month, 2 weeks назад @ t.me
От цифр к стратегии: как использовать ИИ для глубокой аналитикиСегодня почти в каждой команде есть цифры, отчеты и дашборды, и это уже база. Но все интересное начинается в момент, когда из этих данных рождаются идеи, гипотезы и понятные решения для бизнеса
От цифр к стратегии: как использовать ИИ для глубокой аналитикиСегодня почти в каждой команде есть цифры, отчеты и дашборды, и это уже база. Но все интересное начинается в момент, когда из этих данных рождаются идеи, гипотезы и понятные решения для бизнеса

От цифр к стратегии: как использовать ИИ для глубокой аналитикиСегодня почти в каждой команде есть цифры, отчеты и дашборды, и это уже база. Но все интересное начинается в момент, когда из этих данных рождаются идеи, гипотезы и понятные решения для бизнеса.О том, как с помощью ИИ сделать аналитику более глубокой и направленной на развитие бизнеса, расскажут на вебинаре «Как превратить данные в стратегию: используем ИИ для генерации бизнес-гипотез и инсайтов» от karpovꓸcourses.Вы узнаете, как превращать данные в стратегические решения, как избавляться от рутины и углублять инсайты, как выстроить более эффективную работу с цифрами и повысить свою ценность как специалиста благодаря ИИ-инструме…

1 month, 3 weeks назад @ t.me
AI-каталогизация: как автоматизировать описание данных?Чем больше данных накапливает компания, тем сложнее в них разобраться.Либо описание БД и BI формируется вручную и требует больших ресурсов команды, либо его просто нет, потому что отложили “на потом”.В
AI-каталогизация: как автоматизировать описание данных?Чем больше данных накапливает компания, тем сложнее в них разобраться.Либо описание БД и BI формируется вручную и требует больших ресурсов команды, либо его просто нет, потому что отложили “на потом”.В AI-каталогизация: как автоматизировать описание данных?Чем больше данных накапливает компания, тем сложнее в них разобраться.Либо описание БД и BI формируется вручную и требует больших ресурсов команды, либо его просто нет, потому что отложили “на потом”.В

AI-каталогизация: как автоматизировать описание данных?Чем больше данных накапливает компания, тем сложнее в них разобраться.Либо описание БД и BI формируется вручную и требует больших ресурсов команды, либо его просто нет, потому что отложили “на потом”.В обоих случаях поиск данных и понимание взаимосвязей начинает зависеть от отдельных специалистов.DataDesc AI решает эту проблему как ИИ-слой знаний поверх БД и BI. Решение автоматически:⚙️создаёт бизнес-описания объектов хранилища⚙️объясняет SQL простым языком⚙️строит lineage⚙️описывает BI-дашборды. Документация всегда будет актуальной. Переложите эту рутину на AI. 30 минут и у вас готово то, на что команда потратила бы несколько месяцев. …

1 month, 3 weeks назад @ t.me
Авито ищет будущих аналитиков данных и ВІ-разработчиковЗапускаем Avito Analyst Bootcamp 2026 — годовую программу, где вы сможете вырасти от стажёра до уверенного мидла 🚀Что такое Avito Analyst Bootcamp?Это ваш шанс погрузиться в мир больших данных, решать
Авито ищет будущих аналитиков данных и ВІ-разработчиковЗапускаем Avito Analyst Bootcamp 2026 — годовую программу, где вы сможете вырасти от стажёра до уверенного мидла 🚀Что такое Avito Analyst Bootcamp?Это ваш шанс погрузиться в мир больших данных, решать Авито ищет будущих аналитиков данных и ВІ-разработчиковЗапускаем Avito Analyst Bootcamp 2026 — годовую программу, где вы сможете вырасти от стажёра до уверенного мидла 🚀Что такое Avito Analyst Bootcamp?Это ваш шанс погрузиться в мир больших данных, решать

Авито ищет будущих аналитиков данных и ВІ-разработчиковЗапускаем Avito Analyst Bootcamp 2026 — годовую программу, где вы сможете вырасти от стажёра до уверенного мидла 🚀Что такое Avito Analyst Bootcamp?Это ваш шанс погрузиться в мир больших данных, решать реальные бизнес-задачи под руководством экспертов Авито и проходить дополнительное обучение от Академии Аналитиков Авито.В каком направлении будете развиваться?➡️ Продуктовая аналитика: А/В-тестирование, воронки, логирование, анализ гипотез.➡️ ВІ-разработка: дашборды, пайплайны, метрики.Почему стоит участвовать?➡️ Карьерный рост по чёткому плану — с контрольными точками и прозрачными критериями.➡️ Сильное комьюнити — общение, обмен опы…

2 months назад @ t.me
Исследовательский проект «Если быть точным» (платформа с открытыми данными и исследования по широкому набору тем), собрали практические гайды как готовить и визуализировать данные, где обобщили опыт за время своей работы.Хочется поддержать коллег. Для прое
Исследовательский проект «Если быть точным» (платформа с открытыми данными и исследования по широкому набору тем), собрали практические гайды как готовить и визуализировать данные, где обобщили опыт за время своей работы.Хочется поддержать коллег. Для прое

Исследовательский проект «Если быть точным» (платформа с открытыми данными и исследования по широкому набору тем), собрали практические гайды как готовить и визуализировать данные, где обобщили опыт за время своей работы.Хочется поддержать коллег. Для проекта это важно и поможет дальше сохранять открытые данные и делать социальные исследования.1) Как сделать запоминающиеся графики: 11 рекомендацийГайд для тех, кому нужно презентовать и объяснять данные.🔸Как выбрать подходящий тип графика🔸Плагины и инструменты для визуализации данных🔸Как отобразить на одном графике показатели разного масштаба2) Подготовка данных к работе: 5 лайфхаковПодойдет всем, кто работает с открытыми данными. Вы узнаете…

2 months, 1 week назад @ t.me
🤖 Агенты на базе LLM звучит как модный тренд, но за ним скрываются конкретные архитектурные решения, ограничения и инженерные компромиссы. Без их понимания агентные системы быстро превращаются в нестабильные и трудно поддерживаемые эксперименты.На открытом
🤖 Агенты на базе LLM звучит как модный тренд, но за ним скрываются конкретные архитектурные решения, ограничения и инженерные компромиссы. Без их понимания агентные системы быстро превращаются в нестабильные и трудно поддерживаемые эксперименты.На открытом 🤖 Агенты на базе LLM звучит как модный тренд, но за ним скрываются конкретные архитектурные решения, ограничения и инженерные компромиссы. Без их понимания агентные системы быстро превращаются в нестабильные и трудно поддерживаемые эксперименты.На открытом

🤖 Агенты на базе LLM звучит как модный тренд, но за ним скрываются конкретные архитектурные решения, ограничения и инженерные компромиссы. Без их понимания агентные системы быстро превращаются в нестабильные и трудно поддерживаемые эксперименты.На открытом уроке вы разберёте, что на самом деле стоит за agentic-подходом и чем он отличается от привычных LLM-приложений с chains, RAG и tools. Мы подробно рассмотрим устройство агента: модель, инструменты, память, планирование и контроль выполнения, а также разберём архитектурные паттерны агентных систем.Вы увидите, как один и тот же агентный сценарий реализуется в разных фреймворках, сравните их подходы и ограничения, поймёте, где агентный подхо…

2 months, 1 week назад @ t.me
⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?Хотите ворваться в аналитику, но боитесь, что не найдете работу? Страх уходит, если вы уверены в правильности своих действий.Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в об
⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?Хотите ворваться в аналитику, но боитесь, что не найдете работу? Страх уходит, если вы уверены в правильности своих действий.Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в об ⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?Хотите ворваться в аналитику, но боитесь, что не найдете работу? Страх уходит, если вы уверены в правильности своих действий.Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в об

⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?Хотите ворваться в аналитику, но боитесь, что не найдете работу? Страх уходит, если вы уверены в правильности своих действий.Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также расскажет как получить оффер быстрее других. Это очень полезное событие для тех кто только зашел в аналитику и для тех, кто хочет зайти в ближайшее время. Особенно если вы не понимаете, какие навыки действительно важны или боитесь, что без опыта вас не возьмут на работу. Кстати, на вебинаре также разберут: как стать ана…

2 months, 1 week назад @ t.me
86% продуктовых аналитиков head+ уровня измеряют успех в профессии по влиянию на выручку и метрики. Данные приводит Lamoda Tech по итогам исследования портрета специалистов лучших IT-компаний*. В нем собраны навыки, метрики и инструменты, ожидаемые работод
86% продуктовых аналитиков head+ уровня измеряют успех в профессии по влиянию на выручку и метрики. Данные приводит Lamoda Tech по итогам исследования портрета специалистов лучших IT-компаний*. В нем собраны навыки, метрики и инструменты, ожидаемые работод 86% продуктовых аналитиков head+ уровня измеряют успех в профессии по влиянию на выручку и метрики. Данные приводит Lamoda Tech по итогам исследования портрета специалистов лучших IT-компаний*. В нем собраны навыки, метрики и инструменты, ожидаемые работод

86% продуктовых аналитиков head+ уровня измеряют успех в профессии по влиянию на выручку и метрики. Данные приводит Lamoda Tech по итогам исследования портрета специалистов лучших IT-компаний*. В нем собраны навыки, метрики и инструменты, ожидаемые работодателями.А чтобы вы могли изучить все актуальные требования, коллеги из Lamoda Tech дают возможность получить бесплатную карьерную консультацию.Как это сделать:1. До 12 февраля заполните форму — расскажите, где вы сейчас и куда хотите попасть, что вызывает сложности.2. До 19 февраля организаторы выберут 3 истории и свяжутся с авторами.3. HR-эксперт на индивидуальной консультации поможет составить персональный план развития.👉 Оставить заявку…

2 months, 1 week назад @ t.me
Эффективны ли ваши ETL-процессы? 👁Проверьте это с бесплатным чек-листом Без регулярного аудита ETL-пайплайны начинают деградировать: растут затраты, ломаются дашборды, а решения принимаются на битых данных. При этом на полноценный аудит часто не хватает вр
Эффективны ли ваши ETL-процессы? 👁Проверьте это с бесплатным чек-листом Без регулярного аудита ETL-пайплайны начинают деградировать: растут затраты, ломаются дашборды, а решения принимаются на битых данных. При этом на полноценный аудит часто не хватает вр Эффективны ли ваши ETL-процессы? 👁Проверьте это с бесплатным чек-листом Без регулярного аудита ETL-пайплайны начинают деградировать: растут затраты, ломаются дашборды, а решения принимаются на битых данных. При этом на полноценный аудит часто не хватает вр

Эффективны ли ваши ETL-процессы? 👁Проверьте это с бесплатным чек-листом Без регулярного аудита ETL-пайплайны начинают деградировать: растут затраты, ломаются дашборды, а решения принимаются на битых данных. При этом на полноценный аудит часто не хватает времени.Эксперты Cloud․ru собрали чек-лист для простой и быстрой диагностики ETL-процессов. Внутри — опыт и лайфхаки в работе с данными. По чек-листу можно оценить надежность, масштабируемость, управляемость и безопасность вашей Data-инфраструктуры, а еще соответствие cloud native-подходу.Как это работает1️⃣Пройдите чек-лист2️⃣Подсчитайте баллы за реализованные практики3️⃣Определите уровень зрелости ETL-процессов4️⃣Получите персональные реко…

2 months, 1 week назад @ t.me
📊 Вышло новое исследование «СУБД Greenplum/ Arenadata DB в облаке–круг Громова 2025»В отчете собраны практические рекомендации, как наиболее эффективно развернуть аналитические СУБД Greenplum и Arenadata DB в облачной инфраструктуре российских провайдеров.
📊 Вышло новое исследование «СУБД Greenplum/ Arenadata DB в облаке–круг Громова 2025»В отчете собраны практические рекомендации, как наиболее эффективно развернуть аналитические СУБД Greenplum и Arenadata DB в облачной инфраструктуре российских провайдеров. 📊 Вышло новое исследование «СУБД Greenplum/ Arenadata DB в облаке–круг Громова 2025»В отчете собраны практические рекомендации, как наиболее эффективно развернуть аналитические СУБД Greenplum и Arenadata DB в облачной инфраструктуре российских провайдеров.

📊 Вышло новое исследование «СУБД Greenplum/ Arenadata DB в облаке–круг Громова 2025»В отчете собраны практические рекомендации, как наиболее эффективно развернуть аналитические СУБД Greenplum и Arenadata DB в облачной инфраструктуре российских провайдеров.Ключевые акценты исследования:➡️ готовность отечественных облачных провайдеров к развертыванию сложных, высоконагруженных программных сервисов,➡️ сравнение IaaS и PaaS-моделей для Greenplum/ADB,➡️ архитектурные рекомендации и типовые риски в среде виртуализации,➡️ анализ предложений ведущих провайдеров на основе реального проекта,➡️ требования к инфраструктуре для обеспечения производительности, безопасности и соответствия регуляторам.Иссл…

2 months, 1 week назад @ t.me
Труба данных Труба данных
последний пост 6 days, 16 hours назад
💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на р
💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на р 💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на р

💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на рынке — присоединяйся и работай по лучшим связкам- Свободный график🔗Присоединиться - https://wavium.ru⚙️ Наш бот - https://t.me/waviumbot⚡️ПОДАТЬ ЗАЯВКУ⚡️ПОДАТЬ ЗАЯВКУ⚡️ПОДАТЬ ЗАЯВКУ

6 days, 16 hours назад @ t.me
Channel created
Channel created

Channel created

6 days, 16 hours назад @ t.me
Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым инте
Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым инте Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым инте

Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым интересно мое мнение на тему, о существовании которой я узнал чисто случайно 7 лет назад. Макс, ты помнишь как ты мне сказал "Так ты ведь получается занимаешься дата инжинирингом?" 😃Я безумно благодарен вам всем за то, что приходили в комменты и писали свое мнение, за бесконечное количество 💩 оставленных под постами, за репосты и материал, который вы приносили. Я смотрю на этот путь, который мы прошли с вами и я вам очень благодарен!По количес…

1 month, 1 week назад @ t.me
https://clickhouse.com/blog/clickhouse-kubernetes-operatorКликхаус выкатил K8S Operator. Это чтобы было изи раскатить клик в кубере.Да-да, давайте не будем базы данных держать в кубернетесе, только bare metal и весь остальной бубнеж.Большинству компаний бу
https://clickhouse.com/blog/clickhouse-kubernetes-operatorКликхаус выкатил K8S Operator. Это чтобы было изи раскатить клик в кубере.Да-да, давайте не будем базы данных держать в кубернетесе, только bare metal и весь остальной бубнеж.Большинству компаний бу

https://clickhouse.com/blog/clickhouse-kubernetes-operatorКликхаус выкатил K8S Operator. Это чтобы было изи раскатить клик в кубере.Да-да, давайте не будем базы данных держать в кубернетесе, только bare metal и весь остальной бубнеж.Большинству компаний будет достаточно и клика в кубере. (хотя, если честно, таким компаниям, наверное, рано в кубер)@ohmydataengineer

2 months, 2 weeks назад @ t.me
Если вы искали качественный туториал про то как использовать Claude Code лучше всего с лучшими настройками на данный момент, то вот, я прнс
Если вы искали качественный туториал про то как использовать Claude Code лучше всего с лучшими настройками на данный момент, то вот, я прнс

Если вы искали качественный туториал про то как использовать Claude Code лучше всего с лучшими настройками на данный момент, то вот, я прнс

3 months, 2 weeks назад @ t.me
https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько ту
https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько ту

https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько туп 😁@ohmydataengineer - канал "Труба данных" про всякое в мире работы с данным

3 months, 3 weeks назад @ t.me
Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике крив
Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике крив

Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике кривая выглядит иначе: после определённого порога контекст начинает не помогать, а мешать. Сигнал тонет в шуме, модель теряет фокус, а качество решений деградирует. Забрал эту картинку себе в копилку как хорошее напоминание.Из этого логично вытекает важный тезис: формулировка задачи вторична, первична политика контекста. Не «как красиво спросить», а что именно и в каком объёме сейчас действительно нужно модели. Принцип «минимум, достаточный дл…

3 months, 3 weeks назад @ t.me
https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andr
https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andr

https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andrej Karpathy — “We’re summoning ghosts, not building animals” - https://www.youtube.com/watch?v=lXUZvyajciY- Ilya Sutskever – "We're moving from the age of scaling to the age of research"- https://www.youtube.com/watch?v=aR20FWCCjAs- Andrej Karpathy: Software Is Changing (Again) - https://www.youtube.com/watch?v=LCEmiRjPEtQИ нет, это не х2 скорость, это он так в реальности говорит 😃@ohmydataengineer - канал "Труба данных" про всякое в мире …

3 months, 3 weeks назад @ t.me
Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer
Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer

Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer

4 months, 1 week назад @ t.me
Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL
Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL

Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL 13-18;- уведомления в Telegram, Slack, Discord, если бекап сломался или база недоступна;- хранение бекапов локально, в S3 или Google Drive;- health check базы данных раз в минуту;- Apache 2.0 лицензия (полностью открытый);Запуск через Docker:docker run -d --name postgresus -p 4005:4005 -v ./postgresus-data:/postgresus-data --restart unless-stopped rostislavdugin/postgresus:latest📌 GitHub

4 months, 1 week назад @ t.me
MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by
MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by

MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by-case basis • Existing issues and pull requests will not be actively reviewed • Community support continues on a best-effort basis through Slackhttps://github.com/minio/minio@ohmydataengineer

4 months, 2 weeks назад @ t.me
https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни
https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни

https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из них что он жрет гигабайт оперативки)@ohmydataengineer

4 months, 2 weeks назад @ t.me
Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.
Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это. Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.

Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.

4 months, 4 weeks назад @ t.me
https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer
https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer

https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer

5 months, 1 week назад @ t.me
https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решени
https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решени

https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решение. Циферки, метрики, замеры внутри, все как вы любите 😃P.S. Конечно же, никто не говорит о том, что Kafka надо заменять на Postgres. The claim isn’t that Postgres is functionally equivalent to any of these specialized systems. The claim is that it handles 80%+ of their use cases with 20% of the development effort.Но поздно, стервятники уже налетели...https://www.morling.dev/blog/you-dont-need-kafka-just-use-postgres-considered-harmful/@ohm…

5 months, 1 week назад @ t.me
enthusiastech enthusiastech
последний пост None
data будни data будни
последний пост 2 months, 1 week назад
📁 про культуру ведения тикетовпродолжаю рассказывать про внутрянку нашей команды, привлекая ваше внимание к активным вакансиям >_>> важный дисклеймер: это не я, это всё наш техлид Кирилл (я тут только документирую и выношу)думаю, все видели тикеты
📁 про культуру ведения тикетовпродолжаю рассказывать про внутрянку нашей команды, привлекая ваше внимание к активным вакансиям >_>> важный дисклеймер: это не я, это всё наш техлид Кирилл (я тут только документирую и выношу)думаю, все видели тикеты

📁 про культуру ведения тикетовпродолжаю рассказывать про внутрянку нашей команды, привлекая ваше внимание к активным вакансиям >_>> важный дисклеймер: это не я, это всё наш техлид Кирилл (я тут только документирую и выношу)думаю, все видели тикеты, прочитав которые, осталось непонятным что́ надо сделать; или задачи, где ты вроде сделал что было написано, но оказалось, что нужно было не то и не так ¯\_(ツ)_/¯ мы в команде стараемся придерживаться культуры ведения задач — попробую описать как я это вижу⌘⌘⌘начнём с того, что создать хороший тикет - это отдельная работа; чтобы понятно описать что надо сделать, надо как минимум представлять проблему и целевое решениеесть базовый паттерн, которого …

2 months, 1 week назад @ t.me
🦀 Clawdbot / Moltbot / OpenClaw там похоже намечается очередной качественный скачок аи-строения: австрийский программист написал автономного (?) ии-агента… и понеслосьформат горячих новостей не мой любимый жанр, но это залетело в моё инфополе с трёх разных
🦀 Clawdbot / Moltbot / OpenClaw там похоже намечается очередной качественный скачок аи-строения: австрийский программист написал автономного (?) ии-агента… и понеслосьформат горячих новостей не мой любимый жанр, но это залетело в моё инфополе с трёх разных

🦀 Clawdbot / Moltbot / OpenClaw там похоже намечается очередной качественный скачок аи-строения: австрийский программист написал автономного (?) ии-агента… и понеслосьформат горячих новостей не мой любимый жанр, но это залетело в моё инфополе с трёх разных сторон:+ Самат Галимов накидал ссылок для понимания контекстаhttps://t.me/ctodaily/1995+ Pragmatic Engineer выпустил интервью с авторомhttps://youtu.be/8lF7HmQ_RgY+ ребята из Шмит16 собрались вместе где-то на Бали и скупают все доступные мак-мини, чтобы устроить ферму из таких аи-агентов сам автор бота не случайный мамкин вайбкодер — он начинал ещё с веб-приложений в начале 2000-х и потом перешёл на приложения айос для первого айфона. пот…

2 months, 1 week назад @ t.me
data будни pinned «📢 ищем дата-коллег к себе в Яндекс Финтех → дата инженеры https://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637 → дата-партнёры (они же системные аналитики двх) https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815 эт
data будни pinned «📢 ищем дата-коллег к себе в Яндекс Финтех → дата инженеры https://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637 → дата-партнёры (они же системные аналитики двх) https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815 эт

data будни pinned «📢 ищем дата-коллег к себе в Яндекс Финтех → дата инженеры https://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637 → дата-партнёры (они же системные аналитики двх) https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815 это прям в нашу команду…»

2 months, 2 weeks назад @ t.me
✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать и
✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать и

✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их…

2 months, 2 weeks назад @ t.me
📢 ищем дата-коллег к себе в Яндекс Финтех→ дата инженерыhttps://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637→ дата-партнёры (они же системные аналитики двх)https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815это прям в нашу команду, то е
📢 ищем дата-коллег к себе в Яндекс Финтех→ дата инженерыhttps://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637→ дата-партнёры (они же системные аналитики двх)https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815это прям в нашу команду, то е

📢 ищем дата-коллег к себе в Яндекс Финтех→ дата инженерыhttps://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637→ дата-партнёры (они же системные аналитики двх)https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815это прям в нашу команду, то есть будем работать вместе) наша команда свежая — начали строить наш двх осенью 2024; поэтому не успели пока обрасти легаси и техдолгами, зато смогли заработать репутацию и кредит доверия за свой первый полный год работы.хотим и дальше нести свет в массы, поэтому активно ищем новых коллегчто у нас есть интересного:→ есть полная документация — наши объекты не идут в прод без описания каждого атрибута→ на нанейминг полей и объектов — есть кон…

2 months, 2 weeks назад @ t.me
✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их
✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их

✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их вместе.⌘ зачем вообще нужно код-ревью+ это вторая пара глаз с иным контекстом и уровнем погружения: автор и ревьюер смотрят на код в разных когнитивных режимах → ловятся разные ошибки+ передача знаний в рамках команды: «применяем вот такие паттерны, а вот так не делаем» → в среднем качестве кода постепенно улучшается+ барьер против энтропии и деградации кодовой базы: без должного присмотра любой проект постепенно превращается в трудно подд…

2 months, 2 weeks назад @ t.me
🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и ви
🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и ви

🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и видеть глобальные тенденции⌘⌘⌘по своему масштабу Мартин сравнивает нынешний скачок с переходом программистов с ассемблера на языки более высокого уровнясам Мартин не имеет ничего против вайбкодинга как такового (тут он понимает «вайбкодинга» именно как безоглядное принятие любого результата ллм-ки без глубокого осознания написанного), однако чётко ограничивает зону его возможностей: небольшие проекты, прототипы на выброс и т.д.главный недост…

4 months, 1 week назад @ t.me
🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддержи
🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддержи

🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддерживает ~230 человек→ сторадж — около 15–20 петабайт;→ компьют — порядка 100К ядер→ внутри ~20 тысяч объектов основная аналитическая СУБД — Greenplum: около 10 кластеров от 30 до 72 нод в каждомпроблемы с текущей архитектурой⌘ Greenplum имеет ограничение на количество параллельных запросов, которые он может обработать эффективно; считается, что это около ста запросов.⌘ система требует постоянного мониторинга и ручного управления распределение…

6 months, 1 week назад @ t.me
а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024
а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024 а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024

а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024

6 months, 1 week назад @ t.me
NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут
NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут

NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут

6 months, 1 week назад @ t.me
🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тез
🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тез

🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тезис высказывает Farhan Thawar, Head of Engineering в Shopify (всё время читаю как Spotify, приходится себя одёргивать и перепроверять)Shopify среди меня известен своим мега-крутым фаундером — Tobias Lütke; слушал его в Lenny's Podcast — создаёт впечатление очень здравого и продвинутого человекакроме того, про него неоднократно упоминал Lex Fridman, что даёт ещё сколько-то очков этому джентельмену и культуре в его компании⌘⌘⌘ещё добавляет ве…

6 months, 3 weeks назад @ t.me
🎧 Podcasts
Data Engineering Podcast Data Engineering Podcast
последний пост None
«Ничего такого» by Dodo Enginnering
последний пост None
Запуск завтра Podcast Запуск завтра Podcast
последний пост 2 days, 11 hours назад
Что генетика знает о вас? | Михаил Гельфанд
Что генетика знает о вас? | Михаил Гельфанд Что генетика знает о вас? | Михаил Гельфанд

Можно ли «подкрутить» себе настройки здоровья? Существует ли ген алкоголизма? Как читают и редактируют ДНК? Самат Галимов говорит с Михаилом Гельфандом — одним из главных биоинформатиков России — о том, что умеет современная генетика, и разбирает популярные мифы.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjc2ro9kSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для масштабных задач: https://slc.tl/j2698 Телеграм-канал Михаила Гельфанда: https://t.me/mikhail_s_gelfand Рекомендации Михаила:Александр Панчин «Сумма биотехнологии»Александр Марков «Рождение сложности. Эволюционная биология сегодня» Евгений Кунин «Логика случая. О природе и происхо…

2 days, 11 hours назад @ share.transistor.fm
Как нейросети меняют правила общения
Как нейросети меняют правила общения Как нейросети меняют правила общения

Почему нам хочется увидеть в искусственном интеллекте собеседника? Как нейросети контролируют ход диалога? И что из-за них меняется в человеческом общении? Культуролог и исследовательница цифровой среды Оксана Мороз объясняет, как общение с искусственным интеллектом влияет на нас.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjdNBa9xSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для проектов разной сложности: https://slc.tl/fmodg⚡️ У этого выпуска есть видеоверсия! Посмотрите ее на нашем YouTube-канале: https://www.youtube.com/@launchtomorrow Будем очень благодарны вам за подписку на канал, лайк и комментарий — это очень поможет нам делать в…

1 week, 2 days назад @ share.transistor.fm
Что происходит с наймом в IT
Что происходит с наймом в IT

Как искать работу в 2026? Короткий ответ: непросто! Вместе с основательницей агентства NEWHR Кирой Кузьменко разбираемся, как меняется найм с ИИ, и проходим весь путь от поиска вакансии до переговоров о зарплате. Реклама. Рекламодатель АО «Селектел». erid: 2SDnjd2g7CDSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для проектов разной сложности: https://slc.tl/vxev6 Агентство Киры: NEWHR.orgКанал Киры: https://t.me/kirafoundКурс про поиск работы: HelloNewJob.orgСлушайте бонусные выпуски «Запуска завтра» и других подкастов студии «Либо/Либо» по подписке Либо/Либо+ в Telegram: https://cutt.ly/zap0225epap и в Apple Podcasts https://cutt.ly/zap0225…

2 weeks, 2 days назад @ share.transistor.fm
Гугл-поиск испортился? Как искать в интернете
Гугл-поиск испортился? Как искать в интернете Гугл-поиск испортился? Как искать в интернете

Раздражает, что выдача в Google замусорена рекламой и нерелевантными ссылками? Вместе с фактчекером Павлом Банниковым разбираемся, почему испортился поиск, что помогает гуглить эффективно и как правильно искать с нейросетями.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjdEyrEdSelectel — Selectel — независимый провайдер, который поможет построить надежную и гибкую инфраструктуру для проектов разной сложности: https://slc.tl/cxf73 Телеграм-канал Павла: https://t.me/pavelbannikovПроекты журналиста-расследователя Хэнка ван Эсса: https://www.digitaldigging.org⚡️ У этого выпуска есть видеоверсия! Посмотрите ее на YouTube: https://youtu.be/0vp_239OXdw. Будем очень благодарны вам за подписку на …

3 weeks, 2 days назад @ share.transistor.fm
Биохакинг. Говорим о привычках в Кремниевой долине
Биохакинг. Говорим о привычках в Кремниевой долине Биохакинг. Говорим о привычках в Кремниевой долине

Да, это выпуск про ванну со льдом, медитации и сауну после работы! Андрей Дороничев — один из создателей мобильного приложения YouTube — рассказывает, что делают технари в Долине, чтобы улучшить здоровье и продуктивность. Реклама. Рекламодатель АО «Селектел». erid: 2SDnjdTcQAmSelectel — провайдер IT-инфраструктуры для ИИ-проектов. Серверы с видеокартами и другие продукты для вашего бизнеса: https://slc.tl/lejz5 Андрей Дороничев: https://www.instagram.com/dobry?igsh=aHByNmFtMXpsb2dz⚡️ У этого выпуска есть видеоверсия! Посмотрите ее на YouTube: https://youtu.be/k9ahY12o3ZA Будем очень благодарны вам за подписку на канал, лайк и комментарий — это очень поможет нам делать видеоверсию и дальше!С…

1 month назад @ share.transistor.fm
Почему всем так нужны видеокарты от NVIDIA
Почему всем так нужны видеокарты от NVIDIA

OpenAI, Anthropic, Google, Meta и другие игроки на рынке искусственного интеллекта каждый год делают ставку на увеличение своих моделей и закупают сотни тысяч графических процессоров, которые производит компания NVIDIA. Как NVIDIA стала главным поставщиком железа для целой индустрии и почему никто пока не смог ее догнать? Разбираемся вместе с бывшим ведущим архитектором AI-решений в NVIDIA Денисом Тимониным.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdwsuEP 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Другие эпизоды подкаста про производство процессоров:Выпуск с инженером из Intel https://pc.st/e/2fNCK2Yhh-TВыпуск про литографию с инженеркой из ASML https://pc.st/e/4…

4 months, 1 week назад @ share.transistor.fm
Суперфоркастинг. Как делать точные прогнозы на будущее
Суперфоркастинг. Как делать точные прогнозы на будущее

Михаил Ягудин — математик, соосновавший группу самых точных форкастеров в мире. Вместе с коллегами Миша предсказывает выборы, войны, пандемии и другие события, способные повлиять на жизни миллионов людей. Самат расспросил Мишу, как устроена работа суперфоркастеров, помогают ли предсказательные навыки в личных целях и какие прогнозы эксперты делают по искусственному интеллекту. Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjcr9Pfd 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Группа «Самоцветы» https://samotsvety.org/Рассылка Нуньо Семпере https://blog.sentinel-team.org/Потренировать предсказания https://sage-future.org/Репорт AI 2027 от сооснователя Самоцветов https://ai…

4 months, 2 weeks назад @ share.transistor.fm
Цифровая хрупкость. Как сохранить важное в сети
Цифровая хрупкость. Как сохранить важное в сети

Возможно, вы помните фразу: «Всё, что попало в интернет, остаётся там навсегда». Оказывается, это не совсем правда. Мы уже потеряли огромную часть интернета и культурного наследия. Почему что-то может пропасть из сети? Как архивируются данные? И кто решает, что нужно сохранить, а что нет? Самат Галимов говорит с исследовательницей интернета Полиной Колозариди и кинокритиком Сергеем Сычёвым.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdhbXiw 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Чёрная Пятница в Либо/Либо с 24 ноября по 1 декабря!Подписка «Либо/Либо+ Telegram» в телеграме со скидкой https://cutt.ly/zap25bfeptg Подписка «Либо/Либо+ Apple Podcasts» со скидкой http…

4 months, 3 weeks назад @ share.transistor.fm
Ваш робоводитель прибыл. Как устроено беспилотное такси
Ваш робоводитель прибыл. Как устроено беспилотное такси

Калифорнийская компания Waymo делает сервис роботакси в разных городах США. Мы позвали инженера оттуда, чтобы разобраться, как научить машину принимать решения и подготовить ее к непредсказуемости на дорогах. В этом эпизоде обсуждаем, как миллиарды миль тестовых заездов, сложные симуляции и каскадеры приближают нас к автономному вождению.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdhbXiw 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Слушайте бонусные эпизоды «Запуск++», а еще другие бонусы студии «Либо/Либо» по подписке ЛибоЛибо+ в Apple Podcasts https://cutt.ly/zap0225epap и в закрытом телеграм-канале Либо/Либо https://cutt.ly/zap0225eptg Подписаться только на «Запус…

4 months, 4 weeks назад @ share.transistor.fm
Как делать технологии доступными
Как делать технологии доступными

Без гаджетов и интернета невозможно представить современную жизнь. Но как ими пользуются люди с нарушениями зрения, слуха или, например, моторики? Можно ли спроектировать систему, которая подойдет всем? О чем надо подумать разработчикам, чтобы не отрезать часть пользователей от цифрового мира? Вместе с Валерией Курмак обсуждаем, как делать технологии доступными.Видео программиста с ДЦП Вани Бакаидова https://t.me/bakaidov/1296Канал Яндекса @yandex_inclusionКанал Леры @neiskluchenieРеклама. Рекламодатель ООО "Яндекс". erid: 2SDnjeMi1Aw 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Слушайте бонусные эпизоды «Запуск++», а еще другие бонусы студии «Либо/Либо» по подписке Либо…

5 months назад @ share.transistor.fm
Как пользоваться нейросетями
Как пользоваться нейросетями

Прямо сейчас корпорации вкладывают сотни миллиардов долларов в развитие искусственного интеллекта, государства договариваются о сотрудничествах, а профессионалы боятся, что их заменят. Совершенно точно происходит что-то большое, но не каждый понимает, как это влияет конкретно на его жизнь. В этом выпуске Самат Галимов разбирается, чем искусственный интеллект полезен в повседневной жизни, как его внедрить и стоит ли это делать. Гость выпуска — Денис Ширяев — один из самых активных пользователей ChatGPT в мире.Как настроить ChatGPT? Инструкция от Дениса: https://github.com/DenisSergeevitch/chatgpt-custom-instructionsРекомендации телеграм-каналов про ИИ от Дениса:Denis Sexy IT https://t.me/den…

5 months, 1 week назад @ share.transistor.fm
Что нового в робототехнике?
Что нового в робототехнике?

С развитием нейросетей роботы стали умнеть в разы быстрее. Если раньше их действия нужно было чётко программировать, то сейчас они умеют самостоятельно складывать вещи после стирки, прокладывать лучшие маршруты до нужных объектов, точно определять вес и форму предмета, который нужно взять, и аккуратно его подхватывать. Какую проблему робототехники смог решить искусственный интеллект? Кто совершает главные прорывы на рынке? И как новые роботы могут повлиять на наш быт, работу, перемещение и даже здоровье? Говорим с Сергеем Никулиным из венчурного фонда Grishin Robotics.Кого читать в LinkedIn, если следишь за робототехникой? Рекомендации Сергея:https://www.linkedin.com/company/grishinrobotics…

5 months, 2 weeks назад @ share.transistor.fm
Крипта в три клика. Как работает кошелек в Телеграме
Крипта в три клика. Как работает кошелек в Телеграме

До сих пор не разобрались в крипте? Возможно, этот эпизод для вас. Уже несколько лет покупать, продавать и обменивать крипту можно прямо в Телеграме. Официальный криптокошелек Wallet обещает, что совершать транзакции в нем так же просто, как отправлять сообщения. Больше никаких бирж и непонятных терминов? Можно ли перевести деньги маме? Кто над этим работает? А что с безопасностью? Отвечает на вопросы руководитель core-команды Кошелька Алексей Шерченков.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdvtLoh 12+Специальная акция с 13 октября по 3 ноября – скидка на три месяца для тарифов «Основной» и «Минимальный» – 20%. Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/tariffСлу…

5 months, 3 weeks назад @ share.transistor.fm
ИИ-психотерапия. Как машина может помочь людям разобраться в себе
ИИ-психотерапия. Как машина может помочь людям разобраться в себе

Психотерапия доступна не всем, а вопросы, с которыми хочется разобраться, есть почти у каждого. Можно ли решить свои трудности с машиной и не идти к психотерапевту? В чем целебность терапии и можно ли тут обойтись без живого человека? Как поставить ИИ на службу терапевтам? В этом эпизоде Самат пытается разобраться, как ИИ проникает в терапию и что это меняет для клиентов и специалистов, а помогает ему в этом психотерапевтка Катя Кронгауз.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjepJgX9 12+Подключай Яндекс360 и работай с командой без проблем https://360.yandex.ru/business/tariffНаписать Кате в телеграме: @ekronhausРекомендация от Кати: Psychoanalytic Perspectives on Migration and Exile…

6 months назад @ share.transistor.fm
Кто такие ИИ-инфлюенсеры и зачем их создают
Кто такие ИИ-инфлюенсеры и зачем их создают

У Аны есть блог с 260 тысячами подписчиков. В нём — красивая жизнь на берегу Адриатического моря, завтраки и ужины в дорогих ресторанах, постоянные путешествия. Ещё один факт об Ане: её на самом деле не существует. Ану сгенерировал искусственный интеллект. Как создают ИИ-персонажей? Кто пользуется этой технологией и как на ней можно заработать? Как отличить профиль настоящего человека от сгенерированного нейросетью? Самат Галимов говорит со специалистом по искусственному интеллекту Артёмом Родичевым. Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjepJgX9 12+Специальная акция с 13 октября по 3 ноября – скидка на три месяца для тарифов «Основной» и «Минимальный» – 20%. Подключай Яндекс 360 по…

6 months, 1 week назад @ share.transistor.fm
Moscow Python Podcast Moscow Python Podcast
последний пост 1 week, 2 days назад
Новости мира Python за март 2026
Новости мира Python за март 2026

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Python 3.15’s JIT is now back on track — https://fidget-spinner.github.io/posts/jit-on-track.html OpenAI покупает Astral — https://openai.com/index/openai-to-acquire-astral/ JazzBand закрывается — https://jazzband.co/news/2026/03/14/sunsetting-jazzband Первый публичный релиз Django Modern Rest — https://github.com/wemake-services/django-modern-rest/releases/tag/0.1.0 Defense in Depth: A Practical Guide to Python Supply Chain Security — https://bernat.tech/posts/securing-python-supply-chain/ The S…

1 week, 2 days назад @ learnpython.podbean.com
JS vs Python: сравнение экосистем на реальном проекте
JS vs Python: сравнение экосистем на реальном проекте

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

3 weeks, 5 days назад @ learnpython.podbean.com
Новости мира Python за февраль 2026
Новости мира Python за февраль 2026

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Мейнтейнер httpx закрыл доступ к issues и discussions — https://github.com/encode/httpx/discussions/3784 Anthropic invests $1.5 million in the Python Software Foundation and open source security — https://pyfound.blogspot.com/2025/12/anthropic-invests-in-python.html Evolving Git for the next decade — https://lwn.net/Articles/1057561/ A CLI to fight GitHub spam — https://hugovk.dev/blog/2026/gh-triage/ Starlette 1.0.0rc1 — https://starlette.dev/release-notes/ Ссылки выпуска:

Курс Learn Python — ht…

1 month назад @ learnpython.podbean.com
Агентские системы от разработки до оценки
Агентские системы от разработки до оценки

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Ссылки от Сергея: toloka.ai - компания

https://platform.toloka.ai/ - self service (быстрая разметка данных)

tendem.ai - Tendem (кентавр AI + human)

как начать работать в Толоке экспертом: https://mindrift.ai/apply Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https…

2 months назад @ learnpython.podbean.com
Новости мира Python за январь 2026
Новости мира Python за январь 2026

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Новости выпуска: убивают ли Python инкрементальные улучшения

релиз Pandas 3.0 недавние тренды Django Security Team в CPython и psutils избавились от busy-polling при работе с subprocess PyPI в 2025 году

PEP 822 — d-string или новый синтаксис для многострочных строковых литералов без лишних отступов Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.r…

2 months, 1 week назад @ learnpython.podbean.com
Как команды используют LLM: агенты, ревью и единый инструмент
Как команды используют LLM: агенты, ревью и единый инструмент

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

2 months, 3 weeks назад @ learnpython.podbean.com
Новости мира Python за декабрь 2025
Новости мира Python за декабрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: тайп-чекер ty от Astral — https://astral.sh/blog/ty

ежегодный топ Python-библиотек — https://tryolabs.com/blog/top-python-...

Microsoft зарелизила mssql-python 1.0.0 — https://techcommunity.microsoft.com/b...

Deprecations via warnings don’t work for Python libraries — https://sethmlarson.dev/deprecations-...

30 things I’ve learned from 30 years as a Python freelancer — https://lerner.co.il/2025/12/08/30-th...

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegr…

3 months, 2 weeks назад @ learnpython.podbean.com
Новости мира Python за 2025 год
Новости мира Python за 2025 год

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Блог Коли Хитрова — https://t.me/nkhitrov_blog

Канал Никиты Соболева — https://t.me/opensource_findings Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python»…

3 months, 3 weeks назад @ learnpython.podbean.com
Новости мира Python за ноябрь 2025
Новости мира Python за ноябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

4 months, 1 week назад @ learnpython.podbean.com
Новый фреймворк задач, безопасность и почему всё ещё нет Async
Новый фреймворк задач, безопасность и почему всё ещё нет Async

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

Ведущие – Григорий Петров и Михаил Корнеев Эфир с Дмитрием про карьеру — https://t.me/geekfactor_devs/16

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

4 months, 1 week назад @ learnpython.podbean.com
Релиз 3.14 и другие новости мира Python за октябрь 2025
Релиз 3.14 и другие новости мира Python за октябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

5 months назад @ learnpython.podbean.com
Почему Python выбирают для масштабирования
Почему Python выбирают для масштабирования

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

5 months, 1 week назад @ learnpython.podbean.com
Новости мира Python за сентябрь 2025
Новости мира Python за сентябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: Full Python support in Wasmer Edge (Beta)

Unlocking Performance in Python's Free-Threaded Future: GC Optimizations Scaling asyncio on Free-Threaded Python Pydantic Ai 1.0 released

PEP 806 – Mixed sync/async context managers with precise async marking Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https:/…

6 months, 2 weeks назад @ learnpython.podbean.com
Отвечаем на вопросы с Никитой Соболевым
Отвечаем на вопросы с Никитой Соболевым

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

В этом выпуске отвечаем на вопросы зрителей вместе с Никитой Соболевым и задаем свои Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

Курс «Основы Python» от Learn Python — …

6 months, 4 weeks назад @ learnpython.podbean.com
Новости мира Python за август 2025
Новости мира Python за август 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: документальный фильм о Python;

StackOverflow Developer Survey;

Python Developer Survey;

Чего ждать от Django 6?;

Astral запускают первый коммерческий продукт. Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал M…

7 months, 1 week назад @ learnpython.podbean.com
Podlodka Podcast Podlodka Podcast
последний пост 4 days, 15 hours назад
Podlodka Deep Dive #1 — C++
Podlodka Deep Dive #1 — C++ Podlodka Deep Dive #1 — C++

Антон Полухин – член комитета по стандартизации C++, что делает его одним из тех людей, кто решает, каким будет C++ в будущем. При этом Антон пишет на C++ высоконагруженный код каждый день в техплатформе городских сервисов Яндекса. Еще он – создатель и активный ментейнер многих библиотек Boost, и автор книги «Boost C++ Application Development Cookbook». C++ пинают все кому не лень – от госдепа США до российских студентов, которые со страхом вспоминают лабы на нем. При этом язык по-прежнему живет везде: системное программирование, игровые движки, финтех, embedded, браузеры. Почему так? Почему у него такая репутация, откуда взялось столько плохого кода, и чем вообще виноваты шаблоны C++? Вмес…

4 days, 15 hours назад @ soundcloud.com
Podlodka #471 – Генерация случайных чисел
Podlodka #471 – Генерация случайных чисел Podlodka #471 – Генерация случайных чисел

Случайные числа нужны почти в каждой программе. Для программиста все выглядит очень просто – достаточно вызова функции стандартной библиотеки. А под капотом там происходит очень много интересного! Чтобы разобраться в том, как генерируются хорошие случайные числа, мы позвали Евгения Додиса, профессора университета Нью-Йорка, который во многом определил, как выглядят и работают современные генераторы случайных чисел, и участвовал в их дизайне для Linux, Apple и Windows. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https…

1 week, 5 days назад @ soundcloud.com
Podlodka #470 – Vim
Podlodka #470 – Vim Podlodka #470 – Vim

Многие думают, что Vim давно уже не актуален и остался мемом и игрушкой для гиков. В выпуске мы обсудили, зачем можно его использовать в современном мире, когда вокруг куча IDE и текстовых редакторов, что из себя представляет осовремененная версия под именем NeoVim и почему она до сих пор актуальна и остается для многих разработчиков способом собрать персональную среду разработки под свой реальный рабочий процесс. Поговорили, в чем принципиальные архитектурные отличия NeoVim от других, почему его сила не только в плагинах, а в самой модели взаимодействия с текстом, как сегодня устроен современный стек с Lua, LSP и Tree-sitter, и с чего начать, если давно хотелось попробовать NeoVim не как э…

2 weeks, 3 days назад @ soundcloud.com
Podlodka #469 – Flutter
Podlodka #469 – Flutter Podlodka #469 – Flutter

Flutter давно стал мейнстримной кросс-платформой и заметным игроком в мобильной разработке: его ценят за быструю разработку и хороший тулинг, в частности hot reload.

Марк Абраменко, бывший Head of Flutter в Surf и мобильный инженер Rhino, разобрал ключевые темы: Impeller и миф о лагах на iOS, ограничения Dart для сложной логики и реальность «одной кодовой базы» для desktop, web и mobile. Конечно же, не могли обойти тему написания кода на Flutter с помощью AI-агентов. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https:…

3 weeks, 2 days назад @ soundcloud.com
Podlodka #468 – Маленькие языковые модели
Podlodka #468 – Маленькие языковые модели Podlodka #468 – Маленькие языковые модели

Что делать, чтобы рынок ИИ не захватили монополисты, и мы все не стали радикально зависимы от OpenAI, Anthropic и других корпораций? Научиться работать с локальным ИИ! Чтобы разобраться в теме мы позвали Ивана Ямщикова из Pleias, и поговорили про то, как устроены маленькие языковые модели. Занятный факт: пока мы писали выпуск, вышла новость о том, что Nvidia в партнерстве с Pleias выпустила открытый датасет в рамках проекта Nvidia Nemotron. Почему открытые датасеты важны для маленьких моделей – тоже обсудили в выпуске! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: w…

1 month назад @ soundcloud.com
Podlodka #467 – Системный подход к релокации
Podlodka #467 – Системный подход к релокации Podlodka #467 – Системный подход к релокации

Переезд в другую страну часто выглядит как выбор между «по зову сердца» и «по таблице в Notion», но на практике успешная релокация почти всегда требует и того, и другого. Это не только выбор визы и билетов, но и большой жизненный проект, требующий принятия десятков решений. В этом выпуске вместе с Василием Юренковым – создателем проекта Greener Relocation, мы обсудили, как понять свои реальные критерии выбора нового места и о чём важно подумать заранее. А ещё поговорили о том, как составить реалистичный роадмап релокации, рассчитать бюджет и не сломаться в процессе, когда заканчиваются силы, расходятся ожидания и растёт стресс. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и…

1 month, 1 week назад @ soundcloud.com
Podlodka #466 – Оконные менеджеры
Podlodka #466 – Оконные менеджеры Podlodka #466 – Оконные менеджеры

Мы редко задумываемся о том, как вообще управляем окнами. Alt-Tab, мышка, перетаскивание, сворачивание – как-то работает и ладно. Но если присмотреться, это один из самых недоосмысленных инструментов в нашей ежедневной работе. Мы проводим за экраном по 8 часов в день, переключаемся между задачами, проектами, контекстами – и при этом живём в модели, которую даже не выбирали. В этом выпуске мы решили поговорить об оконных менеджерах и том, что стоит за терминами stacking, tiling, workspaces. Обсудили ментальную модель управления экраном, контроль, снижение хаоса и то, как меняется ощущение от работы, когда вы перестаёте случайно двигать окна мышкой. Разобрались, чем тайлинг отличается от стек…

1 month, 2 weeks назад @ soundcloud.com
Podlodka #465 – OCaml
Podlodka #465 – OCaml Podlodka #465 – OCaml

OCaml – уникальный язык и по своему историческому значению, и по фичам. Он сильно повлиял практически на все современные языки, на нем до сих пор написаны многие из их компиляторов, и одновременно с этим он считается идеальным входом для новичков в мир функционального программирования. А погружаемся в этот язык мы вместе с Павлом Аргентовым, программистом из Evrone, который страстно любит OCaml и пишет на нем очень много кода. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в в…

1 month, 3 weeks назад @ soundcloud.com
Podlodka #464 – Хэш таблицы
Podlodka #464 – Хэш таблицы Podlodka #464 – Хэш таблицы

Хэш-таблицы – одна из самых элегантных структур данных: простая на поверхности и бесконечно глубокая внутри. Андрей Аксенов, автор поискового движка Sphinx, разбирает их устройство от фундамента до тонкостей реализации. В выпуске обсуждаем два подхода к разрешению коллизий: Open addressing и Buckets, выбор хэш-функций для разных задач, развенчиваем популярные мифы вроде "load factor больше 0.5 – это смерть". Разбираемся, нужны ли криптографические хэш-функции, когда имеет смысл писать свою хэш-таблицу и почему скорость хэш-функции не всегда благо. Выпуск для тех, кто хочет понимать, что происходит под капотом стандартных коллекций, и для тех, кто задумывается о собственных реализациях. Такж…

2 months назад @ soundcloud.com
Podlodka #463 – Чиним спину программиста
Podlodka #463 – Чиним спину программиста Podlodka #463 – Чиним спину программиста

Программисты — одна из самых уязвимых групп по боли в спине и шее. Причина не только в сидячей работе, но и в длительной неподвижности, высокой концентрации и редких перерывах. В этом выпуске обсуждаем, что происходит с позвоночником при долгом сидении, как снизить риск протрузий и грыж и что делать, если они всё-таки появились, и когда это действительно опасно. Также разбираемся, можно ли избежать проблем со спиной, купив специальное кресло или standing desk, действительно ли помогает массаж, на все ли вопросы можно ответить с помощью МРТ, и собираем простой чек-лист, за чем следить, чтобы ходить к врачам как можно реже. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсе…

2 months, 1 week назад @ soundcloud.com
Podlodka #462 – СДВГ (ADHD) у айтишников
Podlodka #462 – СДВГ (ADHD) у айтишников Podlodka #462 – СДВГ (ADHD) у айтишников

Про СДВГ (синдром дефицита внимания и гиперактивности) сегодня говорят много и громко. В соцсетях он превращается то в универсальное объяснение всех проблем, то в модный ярлык, то в повод для шуток. Поэтому в этом выпуске мы решили поговорить о СДВГ с консультантом по корпоративному ментальному здоровью Натальей Кисельниковой, которая плотно работает с этим и рассматривает через науку и свой опыт, а не призму трендов. Обсудили, что вообще считается СДВГ сегодня, как выглядит корректная диагностика и каким образом работать с поставленным диагнозом. Отдельно порассуждали о том, почему в IT-сфере много людей с СДВГ и как этот синдром может быть одновременно преимуществом и серьезным вызовом дл…

2 months, 2 weeks назад @ soundcloud.com
Podlodka #461 – Железо для ИИ
Podlodka #461 – Железо для ИИ Podlodka #461 – Железо для ИИ

Этот выпуск – луч надежды для отчаявшихся геймеров, смирившихся, что все видеокарты сметут ИИ-корпорации. Говорим про чипы, на которых обучение и инференс работают кратно быстрее, чем на GPU. В чем секрет, и чего ожидать в будущем – обсуждаем с Зигфридом Звездиным из Cerebras! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в выпуске:

Женя Кателла, Егор Толстой Полезные ссылки: Telegram гостя

https://t.me/ziggerzz LinkedIn гостя

https://www.linkedin.com/in/zigfrid/

2 months, 3 weeks назад @ soundcloud.com
Podlodka #460 – Emacs
Podlodka #460  – Emacs Podlodka #460 – Emacs

Программируемый текстовый редактор для программирования — от программистов. Звучит как утопия? Нет, это Emacs!

Инструменту уже больше 40 лет, но он отказывается умирать. Более того, некоторые разработчики переезжают на него с современных IDE. Чтобы разобраться в этой магии, мы позвали Дмитрия Бушенко — ветерана разработки и знатока Emacs.

Разобрали архитектуру и то, как она обеспечивает невероятную расширяемость Emacs, почему этот редактор иногда называют операционной системой (без нормального текстового редактора), узнали, почему гость бросил Vim ради Emacs, и поразмышляли, есть ли смысл страдать с конфигами в эпоху AI и VS Code.

Выпуск для тех, кто хочет понять философию true-инженерии и …

2 months, 4 weeks назад @ soundcloud.com
Podlodka #459 – Системный подход к блогингу
Podlodka #459 – Системный подход к блогингу Podlodka #459 – Системный подход к блогингу

В 2026 году профессия блогера становится всё популярнее. Число авторов и создателей контента в соцсетях продолжает расти, форматов становится больше, а бренды всё активнее вкладываются в инфлюенсер-маркетинг. Мы уже говорили про личный бренд разработчика, про техноблогинг, про YouTube, про то, как писать хорошие тексты — настало время свести всё в единый фреймворк! Вместе с Павлом Комаровским, автором канала @RationalAnswer (106k подписчиков в Telegram), мы прошлись по всем аспектам блогинга: зачем им заниматься, как выбрать площадку и формат, как продвигаться, как делать классный контент и какие есть способы на этом всём заработать. Перед вами — системный, структурированный и очень весёлый…

3 months назад @ soundcloud.com
Podlodka #458 – Клавиатуры
Podlodka #458 – Клавиатуры Podlodka #458 – Клавиатуры

Средний программист за всю свою карьеру трогает клавиатуру около 40 тысяч часов. Задумайтесь, в мире очень мало вещей, с которыми вы взаимодействуете настолько часто и тесно. Если вы готовы вложить свое время в то, чтобы сделать эти тысячи часов приятнее, здоровье – лучше, а продуктивность – выше, то обязательно слушайте этот выпуск! Вместе с Дмитрием Ковалевым мы разбираемся во всех видах кастомных клавиатур, их железных и программных составляющих и алгоритме выбора идеального гаджета именно для вас. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/po…

3 months, 1 week назад @ soundcloud.com
Проветримся! Проветримся!
последний пост 1 month, 3 weeks назад
Андрей Себрант: экзоскелеты и роботы
Андрей Себрант: экзоскелеты и роботы

Андрей Себрант — директор Яндекса по стратегическому маркетингу, автор и ведущий подкаста "Трёп Себранта", автор телеграм канала TechSparks. Подкаст: https://sebrant.chat/ Канал: https://t.me/techsparks Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

1 month, 3 weeks назад @ buzzsprout.com
Александ Ерин: Автоматизация продаж
Александ Ерин: Автоматизация продаж

Александр Ерин создатель Linked Helper. Теорема, о которой Александр говорит в выпуске: https://drive.google.com/file/d/1ZwgEAEh319Jz3ea5uCfgRbU0z_dkskNh/view?pli=1 Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

3 months, 4 weeks назад @ buzzsprout.com
Василий Королишин: спина айтишника
Василий Королишин: спина айтишника

Василий Королишин стажировался в Южной Корее и США, а сейчас входит в ряд международных ассоциаций врачей (NASS, EANS и RASS). Он является автором 20+ научных публикаций. За 15 лет практики он помог более 10 000 пациентам. Мы поговорили про то, как поддерживать здоровье спины, если вы работаете сидя. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

4 months, 2 weeks назад @ buzzsprout.com
Дмитрий Волков: риски искусственного интеллетка
Дмитрий Волков: риски искусственного интеллетка

Дмитрий Волков старший исследователь в Palisade Research. Он занимается изучением рисков, связанных с искусственным интеллектом. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

4 months, 4 weeks назад @ buzzsprout.com
Максим Мусин: агенты пишут код
Максим Мусин: агенты пишут код

Максим Мусин основатель и СЕО частной лаборатории Rebels AI. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

5 months назад @ buzzsprout.com
Артём Москалёв: как искусственный интеллект помогает разрабатывать лекарства
Артём Москалёв: как искусственный интеллект помогает разрабатывать лекарства

Артем Москалев исследователь, занимающийся применением искусственного интеллекта для фармакологических разработок. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

5 months, 2 weeks назад @ buzzsprout.com
Игорь Лабутин: мьюзикл про искусственный интеллект
Игорь Лабутин: мьюзикл про искусственный интеллект

Игорь Лабутин — специалист по машинному обучению, учёный, музыкант и продюсер. На фестивале Edinburgh Fringe с 11 по 16 августа 2025 пройдёт премьера его иммерсивного мюзикла AI: Save Our Souls. Сайт мьюзикла: aisaveoursouls.com Даты: 11–16 августа Место: Lime Studio at Greenside @ George Street Время: 19:45 (45 минут, без перерыва) Билеты: £12 / £9 https://www.edfringe.com/tickets/whats-on/ai-save-our-souls Instagram проекта: https://www.instagram.com/aisaveoursouls/ Indiegogo проекта h...

8 months, 2 weeks назад @ buzzsprout.com
Илья Смоленский: питание и психическое здоровье
Илья Смоленский: питание и психическое здоровье

Илья Смоленский — нейробиолог, постдок унивеситета Базеля. Илья ведёт телеграм канал Молекулярная психиатрия и подкаст Эффект наблюдателя. Книги, которые нам посоветовал Илья: Felice Jacka. Brain Changer Georgia Ede. Change Your Diet, Change Your Mind Jonh Cryan, Ted Dinan. Psychobiotic Revolution Джулия Эндерс. Очаровательный кишечник. Как самый могущественный орган управляет нами Netflix - Hack Your Health. The Secrets of Your Gut Support the show ApplePodcasts: https://apple.co/2Psx8yd ...

9 months назад @ buzzsprout.com
Юрий Машенцев: Адаптивный футбол для детей
Юрий Машенцев: Адаптивный футбол для детей

Юрий Машенцев первый партнер сети кофеен «Дринкит» и создатель футбольного клуб для адаптивных детей «Юнити». Основная цель клуба — дать возможность детям с синдромом Дауна через спорт проживать яркие эмоции — азарт, злость, радость от побед. Канал клуба в Юнити в телеграм: t.me/legionchance. Канал Юрия: t.me/billoncoffee. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

9 months, 1 week назад @ buzzsprout.com
Антон Маскелиаде: как делать свою музыку
Антон Маскелиаде: как делать свою музыку

Антон Маскелиаде музыкант, основатель школы, автор книги "Твой первый трек" и карточек для музыканов "Твой второй трек". Школа https://maskeliade.school/ Книга https://maskeliade.school/book Карточки https://maskeliade.school/cards Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

9 months, 3 weeks назад @ buzzsprout.com
Comand Line Heroes by RedHat Comand Line Heroes by RedHat
последний пост None
Python Bytes Python Bytes
последний пост 1 week, 5 days назад
#476 Common themes
#476 Common themes #476 Common themes

Topics include Migrating from mypy to ty: Lessons from FastAPI, Oxyde ORM, Typeshedded CPython docs, and Raw+DC Database Pattern: A Retrospective.

1 week, 5 days назад @ pythonbytes.fm
#475 Haunted warehouses
#475 Haunted warehouses #475 Haunted warehouses

Topics include Lock the Ghost, Fence for Sandboxing, MALUS: Liberate Open Source, and Harden your GitHub Actions Workflows with zizmor, dependency pinning, and dependency cooldowns.

2 weeks, 5 days назад @ pythonbytes.fm
#474 Astral to join OpenAI
#474 Astral to join OpenAI #474 Astral to join OpenAI

Topics include Starlette 1.0.0, Astral to join OpenAI, , and Fire and forget (or never) with Python’s asyncio.

3 weeks, 5 days назад @ pythonbytes.fm
#473 A clean room rewrite?
#473 A clean room rewrite? #473 A clean room rewrite?

Topics include , refined-github, , and Agentic Engineering Patterns.

1 month назад @ pythonbytes.fm
#473 A clean room rewrite?
#473 A clean room rewrite? #473 A clean room rewrite?

Topics include , refined-github, , and Agentic Engineering Patterns.

1 month назад @ pythonbytes.fm
#472 Monorepos
#472 Monorepos #472 Monorepos

Topics include Setting up a Python monorepo with uv workspaces, cattrs, Learning to program in the AI age, and VS Code extension.

1 month, 1 week назад @ pythonbytes.fm
#471 The ORM pattern of 2026?
#471 The ORM pattern of 2026? #471 The ORM pattern of 2026?

Topics include Raw+DC: The ORM pattern of 2026, pytest-check releases, Dataclass Wizard, and SQLiteo.

1 month, 2 weeks назад @ pythonbytes.fm
#470 A Jolting Episode
#470 A Jolting Episode #470 A Jolting Episode

Topics include Better Python tests with inline-snapshot, jolt Battery intelligence for your laptop, Markdown code formatting with ruff, and act - run your GitHub actions locally.

1 month, 3 weeks назад @ pythonbytes.fm
#469 Commands, out of the terminal
#469 Commands, out of the terminal #469 Commands, out of the terminal

Topics include Command Book App, uvx.sh: Install Python tools without uv or Python, Ending 15 years of subprocess polling, and.

2 months, 1 week назад @ pythonbytes.fm
#468 A bolt of Django
#468 A bolt of Django #468 A bolt of Django

Topics include django-bolt: Faster than FastAPI, but with Django ORM, Django Admin, and Django packages, pyleak, , and Datastar.

2 months, 2 weeks назад @ pythonbytes.fm
#467 Toads in my AI
#467 Toads in my AI #467 Toads in my AI

Topics include GreyNoise IP Check, tprof: a targeting profiler, and TOAD is out.

2 months, 3 weeks назад @ pythonbytes.fm
#466 PSF Lands $1.5 million
#466 PSF Lands $1.5 million #466 PSF Lands $1.5 million

Topics include , PSF Lands a $1.5 million sponsorship from Anthropic, How uv got so fast, and PyView Web Framework.

2 months, 4 weeks назад @ pythonbytes.fm
#465 Stack Overflow is Cooked
#465 Stack Overflow is Cooked #465 Stack Overflow is Cooked

Topics include port-killer, How we made Python's packaging library 3x faster, and.

3 months назад @ pythonbytes.fm
#464 Malicious Package? No Build For You!
#464 Malicious Package? No Build For You! #464 Malicious Package? No Build For You!

Topics include ty: An extremely fast Python type checker and LSP, Python Supply Chain Security Made Easy, typing_extensions, and MI6 chief: We'll be as fluent in Python as we are in Russian.

3 months, 1 week назад @ pythonbytes.fm
#463 2025 is @wrapped
#463 2025 is @wrapped #463 2025 is @wrapped

Topics include Has the cost of building software just dropped 90%?, , How FOSS Won and Why It Matters, and.

3 months, 3 weeks назад @ pythonbytes.fm
Software Engineering Daily Software Engineering Daily
последний пост 2 days, 16 hours назад
Agentic Mesh with Eric Broda
Agentic Mesh with Eric Broda

AI agents are evolving from individual productivity tools into distributed systems components inside enterprises. The next frontier is coming into focus, and it involves large-scale ecosystems of collaborating agents embedded directly into business processes. However, multi-agent architectures introduce serious challenges around orchestration, state management, trust, governance, and observability. Eric Broda is a veteran of the

The post Agentic Mesh with Eric Broda appeared first on Software Engineering Daily.

2 days, 16 hours назад @ softwareengineeringdaily.com
New Relic and Agentic DevOps with Nic Benders
New Relic and Agentic DevOps with Nic Benders

Observability emerged from the need to understand complex software systems, and involves tracking metrics, logs, and traces so engineers can detect and diagnose problems before they affect users. However, modern applications often encompass hundreds of services, containers, and dependencies, generating more observability data than dashboards and alerts alone can effectively surface. New Relic is a

The post New Relic and Agentic DevOps with Nic Benders appeared first on Software Engineering Daily.

4 days, 16 hours назад @ softwareengineeringdaily.com
Mobile App Security with Ryan Lloyd
Mobile App Security with Ryan Lloyd

Mobile apps have become a primary interface for critical services, including banking, payments, and healthcare. Unlike web applications, much of the logic and intellectual property in a mobile app lives directly on the user’s device, which is an environment the developer doesn’t control. That makes mobile apps uniquely exposed to reverse engineering, runtime manipulation, and

The post Mobile App Security with Ryan Lloyd appeared first on Software Engineering Daily.

1 week, 2 days назад @ softwareengineeringdaily.com
FastMCP with Adam Azzam and Jeremiah Lowin
FastMCP with Adam Azzam and Jeremiah Lowin

The Model Context Protocol, or MCP, gives developers a common way to expose tools, data, and capabilities to large language models, and it has quickly become an important standard in agentic AI. FastMCP is an open source project stewarded by the team at Prefect, which is an orchestration platform for AI and data workflows. The

The post FastMCP with Adam Azzam and Jeremiah Lowin appeared first on Software Engineering Daily.

1 week, 4 days назад @ softwareengineeringdaily.com
SED News: OpenCode, AI Code vs. Shipped Code, and the LiteLLM Breach
SED News: OpenCode, AI Code vs. Shipped Code, and the LiteLLM Breach

SED News is a monthly podcast from Software Engineering Daily where hosts Gregor Vand and Sean Falconer unpack the biggest stories shaping software engineering, Silicon Valley, and the broader tech industry. In this episode, they cover the resurgence of ARM and CPUs as serious compute infrastructure for running local AI agents, a supply chain attack

The post SED News: OpenCode, AI Code vs. Shipped Code, and the LiteLLM Breach appeared first on Software Engineering Daily.

2 weeks, 2 days назад @ softwareengineeringdaily.com
FreeBSD with John Baldwin
FreeBSD with John Baldwin

FreeBSD is one of the longest-running and most influential open-source operating systems in the world. It was born from the Berkeley Software Distribution in the early 1990s, it has powered everything from high-performance networking infrastructure to game consoles and content delivery networks. Over three decades, it has evolved through major architectural shifts, from symmetric multiprocessing

The post FreeBSD with John Baldwin appeared first on Software Engineering Daily.

2 weeks, 4 days назад @ softwareengineeringdaily.com
Cilium, eBPF, and Modern Kubernetes Networking with Bill Mulligan
Cilium, eBPF, and Modern Kubernetes Networking with Bill Mulligan

Modern cloud-native systems are built on highly dynamic, distributed infrastructure where containers spin up and down constantly, services communicate across clusters, and traditional networking assumptions break down. Linux networking was designed decades ago around static IPs and linear rule processing, which makes it increasingly difficult to achieve scale in Kubernetes environments. At the same time,

The post Cilium, eBPF, and Modern Kubernetes Networking with Bill Mulligan appeared first on Software Engineering Daily.

3 weeks, 2 days назад @ softwareengineeringdaily.com
Games That Push Back with Bennett Foddy
Games That Push Back with Bennett Foddy

Bennett Foddy is a legendary game designer known for creating wholly distinctive games such as QWOP, Getting Over It with Bennett Foddy, and the recently released Baby Steps. He’s also a former professor at the NYU Game Center, where he taught game design alongside developing his own experimental work. In this episode, Bennett joins Joe

The post Games That Push Back with Bennett Foddy appeared first on Software Engineering Daily.

3 weeks, 4 days назад @ softwareengineeringdaily.com
Prettier and Opinionated Code Formatting with James Long
Prettier and Opinionated Code Formatting with James Long

Developer tooling shapes how software gets written day to day, but the best tools often disappear into the background once they succeed. Formatting, linting, and build systems can either create friction and endless debate, or quietly remove entire classes of problems from a team’s workflow. Over the past decade, the JavaScript ecosystem has wrestled with

The post Prettier and Opinionated Code Formatting with James Long appeared first on Software Engineering Daily.

1 month назад @ softwareengineeringdaily.com
Skate Story with Sam Eng
Skate Story with Sam Eng

Skateboarding games have long balanced technical precision with a sense of flow and expression, but Skate Story takes the genre in a radically different direction. It has a distinct vaporwave vibe and blends fluid skate mechanics with exploration, puzzles, and an existential narrative about freedom, pain, and obsession. The game was created by indie developer

The post Skate Story with Sam Eng appeared first on Software Engineering Daily.

1 month назад @ softwareengineeringdaily.com
DeepMind’s RAG System with Animesh Chatterji and Ivan Solovyev
DeepMind’s RAG System with Animesh Chatterji and Ivan Solovyev

Retrieval-augmented generation, or RAG, has become a foundational approach to building production AI systems. However, deploying RAG in practice can be complex and costly. Developers typically have to manage vector databases, chunking strategies, embedding models, and indexing infrastructure. Designing effective RAG systems is also a moving target, as techniques and best practices evolve in step

The post DeepMind’s RAG System with Animesh Chatterji and Ivan Solovyev appeared first on Software Engineering Daily.

1 month, 1 week назад @ softwareengineeringdaily.com
Reinventing the Python Notebook with Akshay Agrawal
Reinventing the Python Notebook with Akshay Agrawal

Interactive notebooks were popularized by the Jupyter project and have since become a core tool for data science, research, and data exploration. However, traditional, imperative notebooks often break down as projects grow more complex. Hidden state, non-reproducible execution, poor version control ergonomics, and difficulty reusing notebook code in real software systems make it hard to

The post Reinventing the Python Notebook with Akshay Agrawal appeared first on Software Engineering Daily.

1 month, 1 week назад @ softwareengineeringdaily.com
Organizational Context for AI Coding Agents with Dennis Pilarinos
Organizational Context for AI Coding Agents with Dennis Pilarinos

AI agents have taken on a growing share of software development work, so much so that the hardest problems are shifting away from code generation towards something new, context. The challenge is now contextualizing why systems work the way they do, how architectural decisions were made, and the sources of truth that exist outside of

The post Organizational Context for AI Coding Agents with Dennis Pilarinos appeared first on Software Engineering Daily.

1 month, 2 weeks назад @ softwareengineeringdaily.com
SED News: OpenClaw Goes Viral, Mistral’s Compute Play, and the Agent Arms Race
SED News: OpenClaw Goes Viral, Mistral’s Compute Play, and the Agent Arms Race

SED News is a monthly podcast from Software Engineering Daily where hosts Gregor Vand and Sean Falconer unpack the biggest stories shaping software engineering, Silicon Valley, and the broader tech industry. In this episode, they cover the viral rise of OpenClaw and its founder’s move to OpenAI, OpenAI’s exploration of ads inside ChatGPT, and Alibaba’s

The post SED News: OpenClaw Goes Viral, Mistral’s Compute Play, and the Agent Arms Race appeared first on Software Engineering Daily.

1 month, 2 weeks назад @ softwareengineeringdaily.com
Amazon’s IDE for Spec-Driven Development with David Yanacek
Amazon’s IDE for Spec-Driven Development with David Yanacek

AI-assisted coding tools have made it easier than ever to spin up prototypes, but turning those prototypes into reliable, production-grade systems remains a major challenge. Large language models are non-deterministic, prone to drift, and often lose track of intent over long development sessions. Kiro is an AI-powered IDE that’s built around a spec-driven development workflow.

The post Amazon’s IDE for Spec-Driven Development with David Yanacek appeared first on Software Engineering Daily.

1 month, 3 weeks назад @ softwareengineeringdaily.com
Habr Podcasts Habr Podcasts
последний пост None
Мысли и Методы Мысли и Методы
последний пост None
Трёп Себранта Трёп Себранта
последний пост 4 months, 2 weeks назад
По волнам моей памяти: от YACm-2016 до YACe-2025
По волнам моей памяти: от YACm-2016 до YACe-2025 По волнам моей памяти: от YACm-2016 до YACe-2025

-=Выпуск 81=- В 2016 мы впервые придумали, как красиво и доходчиво демонстрировать достижения тогдашнего генеративного ИИ: в финале маркетингового YACm Саша и Ваня исполнили песню с альбома "Нейронная оборона", написанную тогдашним ИИ. Финал образовательного YACe нынешнего, 2025-го, года прошел в оживленной дискуссии с ИИ, который помогает Леше Комиссарову вести семинары (а иногда и вовсе его замещает). Между двумя этими точками были девять очень интересных лет. Аудиозаписи нескольких событий я собрал в этот выпуск и добавил, как положено, некоторое количество собственного трепа. Некоторые полезные ссылки по теме: Предыдущий наш подкаст с Лешей YAC/m-2016 YAC/e-2025

4 months, 2 weeks назад @ sebrant.chat
Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании
Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании

-=Выпуск 80=- Леша — биолог, который при этом читает в ИТМО курс “Программирование на естественном языке” — и это не хайп вокруг вайб-кодинга, а обучение новым практикам научной работы во времена ИИ. Для Леши важно общаться с окружающими его ИИ голосом, и это оказалось очень удобно для подкаста: к нашей беседе подключались его ИИ-агенты; разговор это заметно оживляло. Говорили мы про ИИ, но нынче это означает, что говорили про жизнь. Очень люблю лешино самопредставление на : Your AI Ever Surprised You? I Study Why | Building Consciousness-First Agents | Consciousness Through Dialogue | Genomics → Machine Minds

6 months, 2 weeks назад @ sebrant.chat
Непричесанные мысли (С) про ИИ летом 2025
Непричесанные мысли (С) про ИИ летом 2025 Непричесанные мысли (С) про ИИ летом 2025

-=Выпуск 79=- Прошло полгода с прошлого выпуска, и я все же вспомнил про “Трёп” и решил записать сольный выпуск; он, по сути, основан на разных лекциях, которые приходилось читать последние месяцы, на самых мне интересных темах в моем канальчике Techsparks, просто на разговорах с умными людьми. Тут и рынок труда, и образование, и роботы — все как я люблю:)

9 months, 2 weeks назад @ sebrant.chat
⌨ Coding
Martin Fowler
последний пост 4 days, 12 hours назад
Fragments: April 14
Fragments: April 14 Fragments: April 14

Martin Fowler: 14 Apr 2026I attended the first Pragmatic Summit early this year, and while there host Gergely Orosz interviewed Kent Beck and myself on stage.

 ❄                ❄                ❄                ❄                ❄Perl is a language I used a little, but never loved.

) — to develop the powerful abstractions that then allow us to do much more, much more easily.

 ❄                ❄                ❄                ❄                ❄Jessica Kerr (Jessitron) has a simple example of applying the principle of Test-Driven Developme…

4 days, 12 hours назад @ martinfowler.com
Alan Turing play in Cambridge MA
Alan Turing play in Cambridge MA Alan Turing play in Cambridge MA

Martin Fowler: 11 Apr 2026Last night I saw Central Square Theater’s excellent production of Breaking the Code.

It’s about Alan Turing, who made a monumental contribution to both my profession and the fate of free democracies.

Well worth seeing if you’re in the Boston area this month.

1 week назад @ martinfowler.com
Fragments: April 9
Fragments: April  9 Fragments: April 9

But the problem with fragments, however valuable, is that they don’t provide a cohesive overview of the situation.

There’s also an informative insight into Uber’s use of microservices (they had 5000 of them), and the way high-growth software necessarily gets rewritten a lot (a phenomenon I dubbed Sacrificial Architecture) ❄                ❄                ❄                ❄                ❄Axios published their post-mortem on their recent supply chain compromise.

 ❄                ❄                ❄                ❄                ❄I rec…

1 week, 2 days назад @ martinfowler.com
Feedback Flywheel
Feedback Flywheel Feedback Flywheel

I propose a structured feedback practice that harvests learnings from AI sessions and feeds them back into the team's shared artifacts, turning individual experience into collective improvement.

That is the flywheel: each rotation of the loop leaves the infrastructure a little better prepared for the next.

Four Types of Signal AI interactions generate signal: information about what the team's artifacts capture well and what they miss.

Every “no, we do it this way” is a line that belongs in the priming document but is not there yet.

Instruction signal.

1 week, 3 days назад @ martinfowler.com
Principles of Mechanical Sympathy
Principles of Mechanical Sympathy Principles of Mechanical Sympathy

This practice can be distilled into a set of everyday principles: Predictable memory access, awareness of cache lines, the single-writer principle, and natural batching.

Back in 2011, a high-frequency trading engineer named Martin Thompson noticed these issues, attributing them to a lack of Mechanical Sympathy.

In this article, I cover the principles of mechanical sympathy I use every day to create systems like these - principles that can be applied most anywhere, at any scale.

Not-So-Random Memory Access Mechanical sympathy starts with understanding how CPUs store, access, and share memory.

which is even larger than the L1 cache, and is used as a sort of buffer between the L1 and L3 caches.

1 week, 4 days назад @ martinfowler.com
Fragments: April 2
Fragments: April  2 Fragments: April 2

The three interact with each other, and the article outlines some general activities teams should do to keep it all under control ❄                ❄In the article she references a recent paper by Shaw and Nave at the Wharton School that adds LLMs to Kahneman’s two-system model of thinking.

 ❄                ❄                ❄                ❄                ❄I’ve seen a few illustrations recently that use the symbols “< >” as part of an icon to illustrate code.

That strikes me as rather odd, I can’t think of any programming language that uses “< >” to surround program elements.

 ❅

2 weeks, 2 days назад @ martinfowler.com
Harness engineering for coding agent users
Harness engineering for coding agent users Harness engineering for coding agent users

The term harness has emerged as a shorthand to mean everything in an AI agent except the model itself - Agent = Model + Harness.

I want to take the liberty here of defining its meaning in the bounded context of using a coding agent.

But coding agents also provide us, their users, with many features to build an outer harness specifically for our use case and system.

Engineering a user harness for a coding agent is a specific form of context engineering.

An LLM-based coding agent can produce almost anything, but committing to a topology narrows that space, making a comprehensive harness more achievable.

2 weeks, 2 days назад @ martinfowler.com
Encoding Team Standards
Encoding Team Standards Encoding Team Standards

AI coding assistants respond to whoever is prompting, and the quality of what they produce depends on how well the prompter articulates team standards.

It lives in people's heads, transfers slowly through pairing and code review, and walks out the door when someone leaves.

A team standard encoded as an AI instruction does not depend on someone remembering to apply it.

During development, a refactoring instruction keeps improvements aligned with team norms, and a security instruction applies the team's threat model rather than a generic checklist.

They are living artifacts that the whole team maintains, sharpened by practice, and improved through the same pull request workflow the team alrea…

2 weeks, 4 days назад @ martinfowler.com
Fragments: March 26
Fragments: March 26 Fragments: March 26

 ❄                ❄                ❄                ❄                ❄Julias Shaw describes how to fix a gap in many people’s use of specs to drive LLMs:Here’s what I keep seeing: the specification-driven development (SDD) conversation has exploded.

 ❄                ❄                ❄                ❄                ❄Lawfare has a long article on potential problems countering covert action by Iran.

The above examples show how robustly the U.S. national security apparatus was able to respond, largely through the FBI and the Justice Departm…

3 weeks, 2 days назад @ martinfowler.com
Bliki: Architecture Decision Record
Bliki: Architecture Decision Record Bliki: Architecture Decision Record

An Architecture Decision Record (ADR) is a short document that captures and explains a single decision relevant to a product or ecosystem.

They should not be modified if the decision is changed, but linked to a superseding decision.

Decisions are usually made under some degree of uncertainty, so it's handy to record the confidence level of the decision.

While ADRs are a form for recording decisions in software architecture, the broader concept of writing short decision records is worth considering in other contexts.

In this he was particularly inspired by Phillipe Kruchten talking about decision registers / decision logs, and by the writing style of software patterns.

3 weeks, 4 days назад @ martinfowler.com
Fragments: March 19
Fragments: March 19 Fragments: March 19

Martin Fowler: 19 Mar 2026David Poll points out the flawed premise of the argument that code review is a bottleneckTo be fair, finding defects has always been listed as a goal of code review – Wikipedia will tell you as much.

And although many people think of code review as pre-integration review done on pull requests, I look at code review as a broader activity both done earlier (Pair Programming) and later (Refinement Code Review).

His overall point is that code review is all about applying judgment, steering the code in a good direction.

 ❄                ❄                ❄                ❄                ❄Chari…

1 month назад @ martinfowler.com
Context Anchoring
Context Anchoring Context Anchoring

I propose externalizing decision context into a living document — external memory that persists what the context window cannot, turning transient alignment into durable shared understanding.

These numbers sound generous, but a productive development session generates context quickly: code snippets, design discussions, decision rationale, file contents.

Context anchoring is the practice of making that alignment durable.

When starting a new session, both are loaded: the project context as the stable foundation, the feature context as the record of where things stand.

For work that stretches across days, full context anchoring pays for itself many times over.

1 month назад @ martinfowler.com
Fragments: March 16
Fragments: March 16 Fragments: March 16

 ❄                ❄                ❄                ❄                ❄Bassim Eledath lays out 8 levels of Agentic Engineering.

I’m sure neither of these Maturity Models is entirely accurate, but both resonate as reasonable frameworks to think about LLM usage, and in particular to highlight how people are using them differently ❄                ❄                ❄                ❄                ❄Chad Fowler thinks we have to change our thinking of what our target is when generating code.

 ❄                ❄       …

1 month назад @ martinfowler.com
Fragments: March 10
Fragments: March 10 Fragments: March 10

We desperately need corporations’ attitudes to shift from “lawbreaking is a low-risk cost of doing business; we get a net profit anyway” to “this could be a death sentence.” ❄                ❄                ❄                ❄                ❄Charity Majors gave the closing keynote at SRECon last year, encouraging people to engage with generative AI.

 ❄                ❄                ❄                ❄                ❄In a comment to Kief Morris’s recent article on Humans and Agents in Software Loops, in LinkedIn comments Renaud W…

1 month, 1 week назад @ martinfowler.com
Ideological Resistance to Patents, Followed by Reluctant Pragmatism
Ideological Resistance to Patents, Followed by Reluctant                Pragmatism Ideological Resistance to Patents, Followed by Reluctant Pragmatism

Software patents are mostly used as roadblocks to innovationThat belief was no longer theoretical when I was confronted with a very real situation where patents were weaponized.

Martin Fowler clearly articulated these concerns in post on software patents.

He explains why software patents are fundamentally broken: too few of them have any true novelty, too many have vague and overly broad claims.

Our reluctant journey to defensive patents What follows is not a rebuttal of that position, but an account of what it means to innovate inside that reality.

The imperfect alternatives to patents Before concluding that defensive patents were the only option, it is worth examining alternatives that ai…

1 month, 2 weeks назад @ martinfowler.com
Антон Жиянов Антон Жиянов
последний пост 3 months, 4 weeks назад
Go-фича: Обновленный go fix
Go-фича: Обновленный go fix Go-фича: Обновленный go fix

КакНовая команда go fix :usage: go fix [build flags] [-fixtool prog] [fix flags] [packages] Fix runs the Go fix tool (cmd/fix) on the named packages and applies suggested fixes.

Index ( s , " " ) if idx == - 1 { return s } return strings .

ReplaceAll ( s , " " , "" ) }// after func nospace ( s string ) string { found := strings .

found { return s } return strings .

TrimPrefix ( s , "> " ) } return s }// after func unindent ( s string ) string { if after , ok := strings .

3 months, 4 weeks назад @ antonz.ru
Утечки горутин в Go 1.24+
Утечки горутин в Go 1.24+ Утечки горутин в Go 1.24+

Вы конечно и так в курсе, но на всякий случай:Утрированный пример утечки:Традиционно Go не очень-то помогал в поиске утечек.

Обнаружить их можно было разве что пристально разглядывая профиль или трассировку с продакшена, а в тестах приходилось использовать сторонний пакет goleak от Убера.

Сейчас это меняется.

Сначала в Go 1.24 добавили пакет synctest, который прекрасно справляется с поиском утечек при тестировании.

Об этом почему-то никто не говорит — наверно, потому что не проходили мой курс по многозадачности 😁

4 months назад @ antonz.ru
Go-фича: Защита секретов
Go-фича: Защита секретов Go-фича: Защита секретов

// Do invokes f.//// Do ensures that any temporary storage used by f is erased in a// timely manner.

(In this context, "f" is shorthand for the// entire call tree initiated by f.)// - Any registers used by f are erased before Do returns.

// - Any stack used by f is erased before Do returns.

// - Any heap allocation done by f is erased as soon as the garbage// collector realizes that it is no longer reachable.

As part of// that, any panic raised by f will appear as if it originates from// Do itself.

4 months, 1 week назад @ antonz.ru
Go-фича: Безопасная проверка ошибок
Go-фича: Безопасная проверка ошибок Go-фича: Безопасная проверка ошибок

// AsType finds the first error in err's tree that matches the type E,// and if one is found, returns that error value and true.

//// The tree consists of err itself, followed by the errors obtained by// repeatedly calling its Unwrap() error or Unwrap() []error method.

// When err wraps multiple errors, AsType examines err followed by a// depth-first traversal of its children.

//// An error err matches the type E if the type assertion err.

(E) holds,// or if the error has a method As(any) bool such that err.As(target)// returns true when target is a non-nil *E. In the latter case, the As// method is responsible for setting target.

4 months, 2 weeks назад @ antonz.ru
Курс: Знакомство с Go
Курс: Знакомство с Go Курс: Знакомство с Go

Для всех, кто уверенно программирует на другом языке и хочет попробовать Go.

4 months, 2 weeks назад @ antonz.ru
Go-фича: Метрики горутин
Go-фича: Метрики горутин Go-фича: Метрики горутин

Подробные метрики горутин от рантайма.

Метрики по состояниям горутин помогают находить типичные проблемы в продакшене.

Много горутин в состоянии not-in-go — значит, они застряли в системных вызовах или cgo.

Добавить следующие метрики в пакет runtime/metrics :Сумма значений показателей по каждому состоянию не обязательно равна общему количеству активных горутин (метрика /sched/goroutines:goroutines , доступна в Go 1.16+).

Запускаем несколько горутин и выводим метрики через 100 мс работы:

4 months, 3 weeks назад @ antonz.ru
Go-фича: Dialer с контекстом
Go-фича: Dialer с контекстом Go-фича: Dialer с контекстом

Новые методы Dialer с поддержкой контекста — DialTCP , DialUDP , DialIP и DialUnix — объединяют эффективную реализацию (как в существующих Dial -функциях) с возможностью отмены (как в Dialer.DialContext ).

Он поддерживает отмену и может использоваться для подключения по любому из поддерживаемых протоколов:func ( d * Dialer ) DialContext ( ctx context .

Context , network string , laddr , raddr netip .

Context , network string , laddr , raddr netip .

Context , network string , laddr , raddr netip .

5 months назад @ antonz.ru
Go-фича: Сравнение IP-подсетей
Go-фича: Сравнение IP-подсетей Go-фича: Сравнение IP-подсетей

Как это делают IANA и Python.

6 months назад @ antonz.ru
Go-фича: Хешеры
Go-фича: Хешеры Go-фича: Хешеры

// Hasher реализует хеширование и проверку на равенство для типа T. type Hasher [ T any ] interface { Hash ( hash * maphash .

// То есть, если Equal(a, b) возвращает true, то Hash(h, a) и Hash(h, b) // должны записывать одинаковые данные в h. Hash ( hash * maphash .

Hasher [ V ], V any ]( hasher H ) * Set [ H , V ] { return & Set [ H , V ]{ seed : maphash .

func ( s * Set [ H , V ]) calcHash ( val V ) uint64 { var h maphash .

func ( s * Set [ H , V ]) Has ( val V ) bool { hash := s . calcHash ( val ) if bucket , ok := s . data [ hash ]; ok { for _ , item := range bucket { if s . hasher .

6 months, 3 weeks назад @ antonz.ru
Go-фича: new(expr)
Go-фича: new(expr) Go-фича: new(expr)

Println ( * p1 ) // 0А теперь можно и с выражениями:// Указатель на переменную типа int со значением 42. p := new ( 42 ) fmt .

Println ( * p2 )42 go// go 1.26 p1 := new ( 42 ) fmt .

Println ( * p2 )42 goУказатель на составное значение:// go 1.25 s := [] int { 11 , 12 , 13 } p1 := & s fmt .

Println ( * p )go// go 1.26 f := func () string { return "go" } p := new ( f ()) fmt .

Println ( * p )goПередавать nil по-прежнему нельзя:// go 1.25 and go 1.26 p := new ( nil ) // compilation errorСсылки𝗣 45624 • 𝗖𝗟 704935, 704737, 704955, 705157

6 months, 3 weeks назад @ antonz.ru
Вам не нужен testify/assert
Вам не нужен testify/assert Вам не нужен testify/assert

Вам не нужен testify/assertМногие Go-разработчики предпочитают ассерты (asserts, проверки в тестах) без if, чтобы тесты были короче и понятнее.

Nil ( t , age ) }Но я не думаю, что для хороших тестов действительно нужен testify/assert с его 40 разными ассертами.

func isNil ( v any ) bool { if v == nil { return true } // Интерфейс может быть не nil, но содержать nil, // поэтому проверяем внутреннее значение.

Стандартное сообщение подскажет, что не так, а номер строки укажет, где искать проблему.

TB , got error , want error ) { tb .

9 months назад @ antonz.ru
Интерактивный тур по Go 1.25
Интерактивный тур по Go 1.25 Интерактивный тур по Go 1.25

Выпуск Go 1.25 запланирован на август, так что сейчас самое время изучить, что нового.

Не делайте так в продакшене ツПоехали!

Мы могли бы сделать таймаут параметром функции (наверное, так и стоило бы), но допустим, что это не вариант.

Внутри пузыря функции пакета time используют искусственные часы, что позволяет тесту пройти мгновенно:Начальное время в пузыре — полночь 2000-01-01 UTC.

Она ждет, пока все горутины в пузыре заблокируются, а затем продолжает выполнение:

9 months, 3 weeks назад @ antonz.ru