Data Engineering
про инжиниринг данных и аналитику
🏢 %company% Engineering
AirBnb Engineering
последний пост 1 week, 2 days назад
Scaling Airbnb’s identity graph with a unified knowledge graph infrastructure
Scaling Airbnb’s identity graph with a unified knowledge graph infrastructure Scaling Airbnb’s identity graph with a unified knowledge graph infrastructure

How Airbnb shifts from PaaS to an internal knowledge graph infrastructure at scale.By: Lucen Zhao, Shukun Yang, Ashish JainKnowledge graphs offer a natural and powerful way to represent relationships between entities. Many real-world systems are fundamentally about connections.Airbnb’s identity graph captures relationships between users in a graph database. The identity graph serves aggregated insights that enable user identity resolution and relationship understanding. These capabilities support a wide range of Trust and Safety use cases, from detecting suspicious activities to identifying linked accounts. Over time, the identity graph has grown into one of the largest and most complex gra…

1 week, 2 days назад @ medium.com
Viaduct 1.0 and the future of Airbnb’s data mesh
Viaduct 1.0 and the future of Airbnb’s data mesh Viaduct 1.0 and the future of Airbnb’s data mesh

Moving from an internal tool to a community-driven, production-ready data mesh.By: Ryan Tanner, Raymie Stata, Adam MiskiewiczIntroductionWe’re excited to announce the 1.0 release of the Viaduct. This release marks a shift from Viaduct being an Airbnb-internal tool that happens to be open source to a true community-driven project with a stable public API. The 1.0 release includes substantial new features and enhancements which we describe in the Viaduct blog.Viaduct is for platform engineers building a company-wide data API, service owners who want to contribute to a shared graph without spinning up their own server, or engineering organizations that have outgrown a single GraphQL service.Wh…

2 weeks, 1 day назад @ medium.com
Monitoring reliably at scale
Monitoring reliably at scale Monitoring reliably at scale

Designing monitoring that works when everything else doesn’t.By: Abdurrahman J. AllawalaIntroductionWhen an incident hits, teams lean on observability to answer the only questions that matter: what’s broken, and why? Monitoring systems are designed to help you answer these questions, and they usually do.But what happens when your observability stack is dependent on the same systems that are failing? In that moment, the dashboards go dark, alerts stop firing, and the tools meant to guide recovery become part of the outage.This is an increasingly common challenge as organizations consolidate onto shared platforms like Kubernetes, service meshes, and other common infrastructure components. At …

3 weeks, 2 days назад @ medium.com
Skipper: Building Airbnb’s embedded workflow engine
Skipper: Building Airbnb’s embedded workflow engine Skipper: Building Airbnb’s embedded workflow engine

How Airbnb built a lightweight workflow engine to solve durable execution.By: Ricardo Gamba, Andriy SergiyenkoIntroduction: The durable execution problemPicture this hypothetical flow: A host submits an insurance claim about their listing to Airbnb. The system needs to validate the claim, run trust and safety checks, assess estimates, process the payout, and send notifications. Halfway through — after the validation passes, but before the payout — the server crashes.What happens next?In a traditional architecture, the answer is often “it depends.” Maybe the operation times out and the guest retries, triggering duplicate processing. Maybe partial state corrupts what comes next. And for workf…

1 month назад @ medium.com
Building a fault-tolerant metrics storage system at Airbnb
Building a fault-tolerant metrics storage system at Airbnb Building a fault-tolerant metrics storage system at Airbnb

How we built a storage system that ingests 50 million samples per second and stores 2.5 petabytes of logical time series data.By: Rishabh KumarModern observability practice encourages instrumenting every meaningful code path. Over the past 15 years, open-source observability SDKs like Prometheus, OpenTelemetry, and StatsD have made deep instrumentation nearly ubiquitous. These days, most software — open-source or custom — can be made observable by default, assuming you actually collect the data.Airbnb is no exception. As our products and infrastructure have evolved, each new feature and each new incident has added another layer of instrumentation. Unsurprisingly, we were generating 1.3 bill…

1 month, 1 week назад @ medium.com
Privacy-first connections: Empowering social experiences at Airbnb
Privacy-first connections: Empowering social experiences at Airbnb Privacy-first connections: Empowering social experiences at Airbnb

Discover how Airbnb prioritizes user privacy while building a more connected community, empowering guests to engage socially, connect confidently, and maintain control of their personal data.By: Joy Jing✨ Building a more connected communityAt Airbnb, our hosts and guests form the heart of our community. As shared by CEO Brian Chesky, we’re evolving into a more social ecosystem. Airbnb Experiences now highlight the people involved as much as the activity. Guests can see Who’s going on an Experience, message co-guests directly, and view people they’ve met through the Connections section in their Airbnb profile. Guests are able to choose to share their profile for each new Experience. Guests w…

1 month, 2 weeks назад @ medium.com
Building a high-volume metrics pipeline with OpenTelemetry and vmagent
Building a high-volume metrics pipeline with OpenTelemetry and vmagent Building a high-volume metrics pipeline with OpenTelemetry and vmagent

A production-tested approach for moving a large-scale metrics pipeline from StatsD to OpenTelemetry and Prometheus.By: Eugene Ma, Natasha AleksandrovaWhen migrating to a new monitoring system, you’ll want to frontload the work to collect all your metrics. This exposes bottlenecks at full write scale and unblocks the migration of assets which require real data for validation, such as dashboards and alerts. Collecting all your metrics first means you can focus on major technical challenges — scale, correctness and performance — without worrying about how users will adopt your new tools.But for our project, this approach wasn’t straightforward: most of our metrics were instrumented with StatsD…

1 month, 3 weeks назад @ medium.com
My Journey to Airbnb — Jonathan Woodard
My Journey to Airbnb — Jonathan Woodard My Journey to Airbnb — Jonathan Woodard

Jonathan Woodard knows defense. After playing professional football as a defensive end for six years, Jonathan knew he wanted a career where he could always face new challenges, learn new skills, and continue to thrive in high-paced environments. After discovering a passion for programming, Jonathan joined Airbnb’s Connect Engineering Apprenticeship program and excelled; now, we’re lucky to have him on our secure development engineering team. Here’s his story.Joining the big leaguesLike many kids, I wanted to grow up to become a professional athlete. Playing professional football was my dream, but over the years, it faded into the background because it seemed unrealistic — until it wasn’t.I…

1 month, 3 weeks назад @ medium.com
What COVID did to our forecasting models (and what we built to handle the next shock)
What COVID did to our forecasting models (and what we built to handle the next shock) What COVID did to our forecasting models (and what we built to handle the next shock)

How Airbnb built forecasting models resilient enough to survive a global pandemic and whatever shock comes next.By: Harrison KatzThe week everything brokeIn March 2020, the forecasting models that had served us well in stable times faced a new challenge: predicting outcomes in a world that had suddenly changed.At Airbnb, many of the financial metrics we forecast depend on two separate events: when guests book, and when they actually travel. A booking made today might correspond to a trip three days from now or three months from now. The distribution of that gap, what we call the lead-time composition, drives how we translate today’s bookings into future revenue (see Figure 1).The pandemic r…

2 months назад @ medium.com
From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership
From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership

How a complex, large-scale migration to an in-house observability platform led to superior tooling, consistent data, and a fundamental reset of the developer experience.By: Callum Jones, Rong HuObservability — the function of providing visibility into the performance and reliability of applications using metrics, logs and traces — is one of the most important tools of the Infrastructure group at any company. Without a reliable, cost-effective, and user-friendly observability platform, you limit an organization’s ability to empower engineers to assess, support, and improve the reliability of their application.Like many of its peers, Airbnb started out by outsourcing its observability needs t…

2 months, 1 week назад @ medium.com
Recommending Travel Destinations to Help Users Explore
Recommending Travel Destinations to Help Users Explore Recommending Travel Destinations to Help Users Explore

How we built a destination recommendation model that helps users spark inspiration and narrow down choices to make journeys smoother.By: Weiwei Guo, Bin Xu, Sundara Rajan Srinivasavaradhan, Jie Tang, Xiaowei Liu, Bharathi Thangamani, Liwei He, Huiji Gao, Tracy Yu, Hui Gao, Stephanie Moyerman, Sanjeev KatariyaAirbnb users in the trip planning stage may not have a clear idea of travel destinations, travel dates, or other preferences. They exhibit different behaviors compared to users who have a clear itinerary in mind. More exploratory users visit the Airbnb platform less often and are less likely to book listings in the near future; they’re more likely to search for a broad area such as “Fra…

2 months, 2 weeks назад @ medium.com
It Wasn’t a Culture Problem: Upleveling Alert Development at Airbnb
It Wasn’t a Culture Problem: Upleveling Alert Development at Airbnb It Wasn’t a Culture Problem: Upleveling Alert Development at Airbnb

How we changed our Observability as Code alert review process and cut development cycles from weeks to minutes.Observability as Code (OaC) — defining alerts, dashboards, and SLOs via code rather than UI — is table stakes for large engineering organizations. With OaC, observability adopts software development’s version control, code review, and testing processes, achieving the same level of discipline as a result. At Airbnb’s scale (thousands of engineers and services), this is the foundation that lets teams ship confidently while maintaining the reliability our guests and hosts depend on.Yet there’s a critical gap in most OaC workflows. While we bring rigor to alert definitions through code…

2 months, 3 weeks назад @ medium.com
Academic Publications & Airbnb Tech: 2025 Year in Review
Academic Publications & Airbnb Tech: 2025 Year in Review Academic Publications & Airbnb Tech: 2025 Year in Review

2025 was a big year for research at Airbnb, as we made significant progress toward our mission to use AI, data science, and machine learning to become the best travel and living platform.Specifically, we doubled down on our presence at long-standing venues like KDD and CIKM — two of the most selective conferences in machine learning. At the same time, we expanded our research footprint by sharing our work in NLP, optimization, and measurement science at conferences such as COLING, LION, and VLDB.Across these conferences, Airbnb researchers engaged directly with academic and industry peers by publishing and presenting papers, learning about the latest innovations, launching new collaboration…

3 months назад @ medium.com
Safeguarding Dynamic Configuration Changes at Scale
Safeguarding Dynamic Configuration Changes at Scale Safeguarding Dynamic Configuration Changes at Scale

How Airbnb ships dynamic config changes safely and reliablyBy Cosmo Qiu, Bo Teng, Siyuan Zhou, Ankur Soni, Willis HarveyDynamic configuration is a core infrastructure capability in modern systems. It allows developers to change runtime behavior without restarting or redeploying services, even as the number of services and requests grows. In practice, that might mean rolling out a new address form for a region launch, tightening an authorization rule, or adjusting timeouts when a dependency is slow.Like any powerful tool, dynamic configuration is a double-edged sword. While it enables fast iteration and rapid incident response, a bad change can cause regressions or even outages. This is a co…

3 months, 1 week назад @ medium.com
My Journey to Airbnb — Anna Sulkina
My Journey to Airbnb — Anna Sulkina My Journey to Airbnb — Anna Sulkina

Anna Sulkina has always been a traveler, and we’re lucky her travels have brought her to Airbnb. Anna is a Senior Director of Engineering, and she’s responsible for Application & Cloud infrastructure. She brings over two decades of industry experience to Airbnb, including work spanning the stack from the frontend to the backend to the plumbing that makes everything come together. Anna is a mother, a passionate trail runner, and an accomplished leader. Here’s Anna’s story in her own words.Discovering a passion after the Soviet UnionI grew up in Eastern Ukraine, and the year I was graduating from high school, the Soviet Union collapsed. Despite the political turmoil, it was an interesting tim…

3 months, 2 weeks назад @ medium.com
Netflix Engineering Netflix Engineering
последний пост None
Pinterest Engineering
последний пост 1 week назад
Making User-Sequence Data More Cost-Efficient, Faster, and Easier to Use
Making User-Sequence Data More Cost-Efficient, Faster, and Easier to Use Making User-Sequence Data More Cost-Efficient, Faster, and Easier to Use

Authors (listed alphabetically)Ads Feature Engineering Infra team: Ajay Venkatakrishnan, Le ZhangCore ML Infra team: Eric Shang, Pihui WeiML Data team: Connor Votroubek, Yi HeUser Understanding team: Camilo Munoz, Simin LiIf you work on ranking, retrieval, or recommendation systems, you’ve probably asked for some version of the same thing: “Give me the last N meaningful actions this user took, with the right enrichments, in a format that’s easy to train and serve ML models.”On paper, that sounds simple. In practice, “user sequences” often become one of the most expensive and fragile parts of the ML data stack.They end up powering everything from training datasets to offline analysis and onl…

1 week назад @ medium.com
An Engineer’s Guide to Better AI Skills: Implementing a Testing Process to Optimize Agent…
An Engineer’s Guide to Better AI Skills: Implementing a Testing Process to Optimize Agent… An Engineer’s Guide to Better AI Skills: Implementing a Testing Process to Optimize Agent…

An Engineer’s Guide to Better AI Skills: Implementing a Testing Process to Optimize Agent Performance in Any Repository or SkillAuthor: Daniel ReedThe tech industry is currently seeing a massive overhaul in the way we work and many are enjoying the benefits of AI agents, particularly when automating engineer workflows and serving domain-specific knowledge. However, relying on agents to consistently invoke a custom skill can be surprisingly unreliable at times.When adopting a new skill intended to help agents write code for Pinterest’s iOS architecture (I’ll call it rx-mvvm) we discovered that sometimes our knowledge skill wasn’t being loaded into our agents. To address this, we conducted a …

2 weeks, 2 days назад @ medium.com
Enhancing Ad Relevance: Integrating Real-Time Context into Sequential Recommender Models
Enhancing Ad Relevance: Integrating Real-Time Context into Sequential Recommender Models Enhancing Ad Relevance: Integrating Real-Time Context into Sequential Recommender Models

Huiqin Xin | Machine Learning Engineer II, Ads Vertical Modeling; Lakshmi Manoharan | Senior Machine Learning Engineer, Ads Vertical Modeling; Karthik Jayasurya | Staff Machine Learning Engineer, Ads Signals; Ziwei Guo | Senior Machine Learning Engineer, Ads Vertical Modeling; Alina Liviniuk | Machine Learning Engineer II, Ads Vertical ModelingMotivation: The Need for Real-Time ContextIn a previous post, Ads Candidate Generation using Behavioral Sequence Modeling, we introduced a candidate generator (CG) that uses a Transformer-based two-tower model to leverage a user’s offsite conversion history — a powerful signal — to predict future interactions with advertisers and specific products. Th…

2 weeks, 6 days назад @ medium.com
Optimizing ML Workload Network Efficiency (Part I): Feature Trimmer
Optimizing ML Workload Network Efficiency (Part I): Feature Trimmer Optimizing ML Workload Network Efficiency (Part I): Feature Trimmer

Guangtong Bai | Staff Software Engineer, Product ML Infrastructure*; Shantam Shorewala | Software Engineer II, Product ML Infrastructure*; Chi Zhang | Staff Software Engineer, AI Platform*; Neha Upadhyay | Software Engineer II, AI Platform*; Haoyang Li | Director, Product ML Infrastructure*These authors contributed equally to this article.BackgroundAt Pinterest, our online ML serving systems employ a root-leaf architecture. On a high level, the architecture looks as follows:Figure 1: Root-leaf Architecture of Online ML Serving Systems at PinterestIn the diagram, “Client Service” is responsible for recommending organic or promoted Pins to users. In order to know if a given Pin is relevant to…

3 weeks, 6 days назад @ medium.com
From Clicks to Conversions: Architecting Shopping Conversion Candidate Generation at Pinterest
From Clicks to Conversions: Architecting Shopping Conversion Candidate Generation at Pinterest From Clicks to Conversions: Architecting Shopping Conversion Candidate Generation at Pinterest

Authors: Richard Huang | Machine Learning Engineer II; Yu Liu | Senior Machine Learning Engineer; Ziwei Guo | Senior Machine Learning Engineer; Andy Mao | Staff Machine Learning Engineer; Supeng Ge | Sr. Staff Machine Learning EngineerIntroductionAt Pinterest, conversion ads are crucial for matching users with products they are likely to purchase, boosting value for both users and advertisers¹. While conversion actions like checkout or add-to-cart are highly valuable, they are also technically challenging to optimize for. Because they occur offsite, conversion events are significantly sparser and noisier than onsite engagement signals. Historically, Pinterest’s shopping ads retrieval relied…

1 month назад @ medium.com
Smarter URL Normalization at Scale: How MIQPS Powers Content Deduplication at Pinterest
Smarter URL Normalization at Scale: How MIQPS Powers Content Deduplication at Pinterest Smarter URL Normalization at Scale: How MIQPS Powers Content Deduplication at Pinterest

Shanhai Liao | Senior Software Engineer, Content Acquisition and Media Platform; Di Ruan, | Senior Staff Software Engineer, Content Acquisition and Media Platform; Evan Li, | Senior Engineering Manager, Content Acquisition and Media PlatformIntroductionAccurate content understanding underpins Pinterest’s ability to drive distribution and engagement. This requires deep insight not just into the image itself, but also the outbound links or items to which those images point. At the foundation of this process lies a deceptively simple problem: URL normalization.When Pinterest ingests content from millions of merchant domains, the same product page often appears under many different URLs. A sing…

1 month, 1 week назад @ medium.com
Finding zombies in our systems: A real-world story of CPU bottlenecks
Finding zombies in our systems: A real-world story of CPU bottlenecks Finding zombies in our systems: A real-world story of CPU bottlenecks

Vaibhav Shankar; Staff Software Engineer | Raymond Lee; Staff Software Engineer | Chia-Wei Chen; Staff Software Engineer | Shunyao Li; Sr. Software Engineer | Yi Li; Staff Software Engineer | Ambud Sharma; Principal Engineer | Saurabh Vishwas Joshi; Principal Engineer | Charles-A. Francisco; Senior Engineer | Karthik Anantha Padmanabhan; Director, Engineering | David Westbrook; Sr. Manager, EngineeringOne day in early 2025, the Kubernetes platform team at Pinterest (PinCompute) got a ping from our partners on the ML platform team. Their Ray-based training jobs , which often take hours of computation on expensive GPU hardware, were crashing. Not every time, but often enough that it was becom…

1 month, 1 week назад @ medium.com
Scaling Recommendation Systems with Request-Level Deduplication
Scaling Recommendation Systems with Request-Level Deduplication Scaling Recommendation Systems with Request-Level Deduplication

Authors: Matt Lawhon | Sr. Machine Learning Engineer; Filip Ryzner | Machine Learning Engineer II; Kousik Rajesh | Machine Learning Engineer II; Chen Yang | Sr. Staff Machine Learning Engineer; Saurabh Vishwas Joshi | Principal EngineerAt Pinterest, scaling our recommendation models delivers outsized impact on the quality of the content we serve to users. Our Foundation Model (oral spotlight, ACM RecSys 2025), for example, achieved a 100x increase in transformer dense parameter counts and a 10x increase in model dimension; translating directly into meaningful quality improvements across multiple recommendation surfaces.¹But a 100x scaleup creates massive infrastructure pressure. Storage, tr…

1 month, 2 weeks назад @ medium.com
Performance for Everyone
Performance for Everyone Performance for Everyone

Author: Lin Wang (Android Performance Engineer)Default FeatureFor mobile apps, performance is considered as the “default feature”, which means apps are expected to run fast and be responsive. It’s just as if we expect a watch to show the time. With no exceptions at Pinterest, we measure, protect and improve performance for all of our key user experiences’ surfaces, such as “Home Feed” and “Search Result Feed”.Hard to MeasureAmong all the performance metrics, the user perceived latency is a crucial one. It measures how much time the user spends since they perform an action until they see the content. This is also called “Visually Complete”.Visually Complete can be very different from app to …

1 month, 2 weeks назад @ medium.com
Evolution of Multi-Objective Optimization at Pinterest Home feed
Evolution of Multi-Objective Optimization at Pinterest Home feed Evolution of Multi-Objective Optimization at Pinterest Home feed

Homefeed: Jiacong He, Dafang He, Jie Cheng (former), Andreanne Lemay, Mostafa Keikha, Rahul Goutam, Dhruvil Deven Badani, Dylan WangContent Quality: Jianing Sun, Qinglong ZengIntroductionIn feed recommendation, we recommend a list of items for the user to consume. It’s typically handled separately from the ranking model where we give probability predictions of user-item pairs.Pinterest’s feed recommendation follows a cascaded system design with retrieval [1][2], pre-ranking [3], ranking [4][5], and re-ranking. While most of these prior works focus on optimizing immediate actions for each candidate Pin, this work will primarily focus on how we build the final layer of the recommendation funn…

1 month, 3 weeks назад @ medium.com
Building an MCP Ecosystem at Pinterest
Building an MCP Ecosystem at Pinterest Building an MCP Ecosystem at Pinterest

Tan Wang | Software Engineer, Agent FoundationsOver the last year, Pinterest has gone from “MCP sounds interesting” to running a growing ecosystem of Model Context Protocol (MCP) servers, a central registry, and production integrations in our IDEs, internal chat surfaces, and AI agents. This post walks through what we’ve built so far, how we designed it, and where we’re taking MCP next.What Is MCP and Why Did We Care?Model Context Protocol (MCP) is an open-source standard that lets large language models talk to tools and data sources over a unified client-server protocol, instead of bespoke, one-off integrations for every model and every tool. At Pinterest, we’re using MCP as the substrate …

2 months, 1 week назад @ medium.com
Unified Context-Intent Embeddings for Scalable Text-to-SQL
Unified Context-Intent Embeddings for Scalable Text-to-SQL Unified Context-Intent Embeddings for Scalable Text-to-SQL

Your Analysts Already Wrote the Perfect PromptAuthors: Keqiang Li, Bin YangIn our previous blog post, we shared how Pinterest built Text-to-SQL with RAG-based table selection (Retrieval-Augmented Generation). That system introduced schema-grounded SQL generation and retrieval-augmented table selection. These were important first steps, but not enough for reliable analytics at Pinterest scale.The challenge was fundamental: with over 100,000 analytical tables and 2,500+ analytical users across dozens of domains, simple keyword matching and table summaries were not enough. When an analyst asks “What’s the engagement rate for organic content by country?”, they need more than a list of tables wi…

2 months, 3 weeks назад @ medium.com
Unifying Ads Engagement Modeling Across Pinterest Surfaces
Unifying Ads Engagement Modeling Across Pinterest Surfaces Unifying Ads Engagement Modeling Across Pinterest Surfaces

Authors: Duna Zhan | Machine Learning Engineer II; Qifei Shen | Senior Staff Machine Learning Engineer; Matt Meng | Staff Machine Learning Engineer; Jiacheng Li | Machine Learning Engineer II; Hongda Shen | Staff Machine Learning EngineerIntroductionPinterest ads show up across multiple product surfaces, such as the Home Feed, Search, and Related Pins. Each surface has different user intent and different feature availability, but they all rely on the same core capability: predicting how likely a user is to engage with an ad.Before this project, the ads engagement stack relied on three independent production models, one per surface. Although the models were initially derived from a similar d…

2 months, 3 weeks назад @ medium.com
Bridging the Gap: Diagnosing Online–Offline Discrepancy in Pinterest’s L1 Conversion Models
Bridging the Gap: Diagnosing Online–Offline Discrepancy in Pinterest’s L1 Conversion Models Bridging the Gap: Diagnosing Online–Offline Discrepancy in Pinterest’s L1 Conversion Models

Authors: Yao Cheng | Senior Machine Learning Engineer; Qingmengting Wang | Machine Learning Engineer II; Yuanlu Bai | Machine Learning Engineer II; Yuan Wang | Machine Learning Engineer II; Zhaohong Han | Machine Learning Engineer Manager ; Jinfeng Zhuang | Senior Machine Learning Engineer ManagerIntroductionThe L1 ranking stage sits in the middle of Pinterest’s ads funnel. It filters and prioritizes candidates under tight latency constraints so that downstream ranking and auction systems only see a manageable set of ads.When we started pushing new L1 conversion (CVR) models, we saw the same pattern repeatedly:Offline: strong, consistent gains on loss and calibration across log sources and …

3 months назад @ medium.com
Piqama: Pinterest Quota Management Ecosystem
Piqama: Pinterest Quota Management Ecosystem Piqama: Pinterest Quota Management Ecosystem

Authors: Junkai Xue | Sr Staff Software Engineer, Big Data Processing Platform; Zheyu Zha | Staff Software Engineer, Big Data Processing Platform; Jia Zhan | Principal Engineer, Online Systems; Alberto Ordonez Pereira | Sr Staff Software Engineer, Online SystemsOverviewA quota is an official limit on the usage or production of a specific resource. At Pinterest, we are developing a robust, generic quota management platform (Piqama) designed to manage a wide range of resources — including physical resources like memory and CPU, service resources such as QPS (queries per second) and network bandwidth, as well as application-specific quota units. Our ecosystem provides seamless quota lifecycle …

3 months назад @ medium.com
Facebook
последний пост 2 days, 23 hours назад
SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems
SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems

We’re introducing SilverTorch, a reimagining of recommendation systems that unifies all retrieval components for user generated content under a unified architecture. SilverTorch shows up to 23.7x higher throughput compared to the state-of-the-art approaches. It’s also showing 20.9x more compute cost efficiency compared to a CPU-based solution while also improving accuracy. Our research paper, “SilverTorch: A [...]

Read More...

The post SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems appeared first on Engineering at Meta.

2 days, 23 hours назад @ engineering.fb.com
Reel Friends: Building Social Discovery that Scales to Billions
Reel Friends: Building Social Discovery that Scales to Billions

On its face the new Friend Bubbles feature looks simple enough. It highlights Reels your friends have watched and reacted to. But sometimes the features that seem the most straightforward require the deepest engineering work. On this episode of the Meta Tech Podcast, Pascal Hartig chats with Subasree and Joseph, two software engineers from the Facebook [...]

Read More...

The post Reel Friends: Building Social Discovery that Scales to Billions appeared first on Engineering at Meta.

2 weeks, 2 days назад @ engineering.fb.com
Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge
Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

We’ve fundamentally transformed Facebook Groups Search to help people more reliably discover, sort through, and validate community content that’s most relevant to them. We’ve adopted a new hybrid retrieval architecture and implemented automated model-based evaluation to address the major friction points people experience when searching community content. Under this new framework, we’ve made tangible improvements [...]

Read More...

The post Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge appeared first on Engineering at Meta.

1 month, 1 week назад @ engineering.fb.com
Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale
Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

We’re sharing insights into Meta’s Capacity Efficiency Program, where we’ve built an AI agent platform that helps automate finding and fixing performance issues throughout our infrastructure. By leveraging encoded domain expertise across a unified, standardized tool interface these agents help save power and free up engineers’ time away from addressing performance issues to innovating on [...]

Read More...

The post Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale appeared first on Engineering at Meta.

1 month, 1 week назад @ engineering.fb.com
How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines
How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

AI coding assistants are powerful but only as good as their understanding of your codebase. When we pointed AI agents at one of Meta’s large-scale data processing pipelines – spanning four repositories, three languages, and over 4,100 files – we quickly found that they weren’t making useful edits quickly enough. We fixed this by building [...]

Read More...

The post How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines appeared first on Engineering at Meta.

1 month, 3 weeks назад @ engineering.fb.com
KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure
KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

This is the second post in the Ranking Engineer Agent blog series exploring the autonomous AI capabilities accelerating Meta’s Ads Ranking innovation. The previous post introduced Ranking Engineer Agent’s ML exploration capability, which autonomously designs, executes, and analyzes ranking model experiments. This post covers how to optimize the low-level infrastructure that makes those models run [...]

Read More...

The post KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure appeared first on Engineering at Meta.

1 month, 3 weeks назад @ engineering.fb.com
Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads
Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

Meta continues to lead the industry in utilizing groundbreaking AI Recommendation Systems (RecSys) to deliver better experiences for people, and better results for advertisers. To reach the next frontier of performance, we are scaling Meta’s Ads Recommender runtime models to LLM-scale & complexity to further a deeper understanding of people’s interests and intent. This increase [...]

Read More...

The post Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads appeared first on Engineering at Meta.

1 month, 4 weeks назад @ engineering.fb.com
AI for American-Produced Cement and Concrete
AI for American-Produced Cement and Concrete

Meta is continuing its long-term roadmap to help the construction industry leverage AI to produce high-quality and more sustainable concrete mixes, as well as those exclusively produced in the United States. Concurrent with the 2026 American Concrete Institute (ACI) Spring Convention, Meta is releasing a new AI model for designing concrete mixes – Bayesian Optimization [...]

Read More...

The post AI for American-Produced Cement and Concrete appeared first on Engineering at Meta.

1 month, 4 weeks назад @ engineering.fb.com
Friend Bubbles: Enhancing Social Discovery on Facebook Reels
Friend Bubbles: Enhancing Social Discovery on Facebook Reels

Friend bubbles in Facebook Reels highlight Reels your friends have liked or reacted to, helping you discover new content and making it easier to connect over shared interests. This article explains the technical architecture behind friend bubbles, including how machine learning estimates relationship strength and ranks content your friends have interacted with to create more [...]

Read More...

The post Friend Bubbles: Enhancing Social Discovery on Facebook Reels appeared first on Engineering at Meta.

2 months, 1 week назад @ engineering.fb.com
Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation
Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation

Meta’s Ranking Engineer Agent (REA) autonomously executes key steps across the end-to-end machine learning (ML) lifecycle for ads ranking models. This post covers REA’s ML experimentation capabilities: autonomously generating hypotheses, launching training jobs, debugging failures, and iterating on results. Future posts will cover additional REA capabilities. REA reduces the need for manual intervention. It manages [...]

Read More...

The post Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation appeared first on Engineering at Meta.

2 months, 1 week назад @ engineering.fb.com
Patch Me If You Can: AI Codemods for Secure-by-Default Android Apps
Patch Me If You Can: AI Codemods for Secure-by-Default Android Apps

Even seemingly simple engineering tasks — like updating an API — can become monumental undertakings when you’re dealing with millions of lines of code and thousands of engineers, especially if the changes are security-related. Nowhere is this more apparent than in mobile security, where a single class of vulnerability can be replicated across hundreds of [...]

Read More...

The post Patch Me If You Can: AI Codemods for Secure-by-Default Android Apps appeared first on Engineering at Meta.

2 months, 2 weeks назад @ engineering.fb.com
RCCLX: Innovating GPU communications on AMD platforms
RCCLX: Innovating GPU communications on AMD platforms

We are open-sourcing the initial version of RCCLX – an enhanced version of RCCL that we developed and tested on Meta’s internal workloads. RCCLX is fully integrated with Torchcomms and aims to empower researchers and developers to accelerate innovation, regardless of their chosen backend. Communication patterns for AI models are constantly evolving, as are hardware [...]

Read More...

The post RCCLX: Innovating GPU communications on AMD platforms appeared first on Engineering at Meta.

3 months назад @ engineering.fb.com
The Death of Traditional Testing: Agentic Development Broke a 50-Year-Old Field, JiTTesting Can Revive It
The Death of Traditional Testing: Agentic Development Broke a 50-Year-Old Field, JiTTesting Can Revive It

WHAT IT IS The rise of agentic software development means code is being written, reviewed, and shipped faster than ever before across the entire industry. It also means that testing frameworks need to evolve for this rapidly changing landscape. Faster development demands faster testing that can catch bugs as they land in a codebase, without [...]

Read More...

The post The Death of Traditional Testing: Agentic Development Broke a 50-Year-Old Field, JiTTesting Can Revive It appeared first on Engineering at Meta.

3 months, 2 weeks назад @ engineering.fb.com
Adapting the Facebook Reels RecSys AI Model Based on User Feedback
Adapting the Facebook Reels RecSys AI Model Based on User Feedback

We’ve improved personalized video recommendations on Facebook Reels by moving beyond metrics such as likes and watch time and directly leveraging user feedback. Our new User True Interest Survey (UTIS) model, now helps surface more niche, high-quality content and boosts engagement, retention, and satisfaction. We’re doubling down on personalization, tackling challenges like sparse user data [...]

Read More...

The post Adapting the Facebook Reels RecSys AI Model Based on User Feedback appeared first on Engineering at Meta.

4 months, 2 weeks назад @ engineering.fb.com
DrP: Meta’s Root Cause Analysis Platform at Scale
DrP: Meta’s Root Cause Analysis Platform at Scale

Incident investigation can be a daunting task in today’s digital landscape, where large-scale systems comprise numerous interconnected components and dependencies DrP is a root cause analysis (RCA) platform, designed by Meta, to programmatically automate the investigation process, significantly reducing the mean time to resolve (MTTR) for incidents and alleviating on-call toil Today, DrP is used [...]

Read More...

The post DrP: Meta’s Root Cause Analysis Platform at Scale appeared first on Engineering at Meta.

5 months, 1 week назад @ engineering.fb.com
Uber Engineering
последний пост None
Spotify Engineering Spotify Engineering
последний пост None
Ripple Engineering Ripple Engineering
последний пост None
Dmitry Anoshin recommends
Snowflake
последний пост None
Cloudera Cloudera
последний пост None
Smart Data
последний пост 5 days, 18 hours назад
How to Use a Competitive Intelligence Dashboard to Turn Market Data Into Smarter Marketing Decisions
How to Use a Competitive Intelligence Dashboard to Turn Market Data Into Smarter Marketing Decisions

Competitive intelligence and analytics can help businesses improve sales, reduce costs, and respond faster to market changes.

5 days, 18 hours назад @ smartdatacollective.com
Reducing “Work About Work” with AI Task Managers
Reducing “Work About Work” with AI Task Managers

The hidden tax on productivity: Using AI to eliminate the busywork that steals your day.

1 month назад @ smartdatacollective.com
The Intersection of Big Data and AI in Project Management
The Intersection of Big Data and AI in Project Management

Discover how AI and big data are helping businesses improve project tracking, reduce risks, and increase returns through better decision-making.

1 month назад @ smartdatacollective.com
Hidden AI, Real Risk: A Governance Roadmap For Mid-Market Organizations
Hidden AI, Real Risk: A Governance Roadmap For Mid-Market Organizations

The silent driver of decisions: Why mid-market companies need AI governance now, not after a crisis.

1 month, 2 weeks назад @ smartdatacollective.com
Signal Or Noise? A Decision Tree For Evaluating Unusual Trading Activity
Signal Or Noise? A Decision Tree For Evaluating Unusual Trading Activity

From confusion to clarity: Using a decision tree to assess whether unusual trading activity truly matters.

1 month, 2 weeks назад @ smartdatacollective.com
AI Agent Trends Shaping Data-Driven Businesses
AI Agent Trends Shaping Data-Driven Businesses

Smarter decisions, faster execution: How AI agents are redefining what data-driven businesses can achieve.

1 month, 2 weeks назад @ smartdatacollective.com
How Data Analytics Helps Developers Deliver Better Tech Services
How Data Analytics Helps Developers Deliver Better Tech Services

A closer look at how developers use analytics and AI tools to improve performance, anticipate issues, and build smarter solutions for tech companies.

1 month, 2 weeks назад @ smartdatacollective.com
Can Data Analytics Help Investors Outperform Warren Buffett
Can Data Analytics Help Investors Outperform Warren Buffett

Exploring whether AI and financial analytics can rival one of the greatest investing track records in history

1 month, 2 weeks назад @ smartdatacollective.com
Signals In The Noise: Using Media Monitoring To Manage Negative Publicity
Signals In The Noise: Using Media Monitoring To Manage Negative Publicity

Separate signal from noise: How proactive media monitoring turns negative chatter into manageable insights.

2 months, 2 weeks назад @ smartdatacollective.com
The Best AI Recruitment Software Solution: Transforming Hiring with Smarter Tech
The Best AI Recruitment Software Solution: Transforming Hiring with Smarter Tech

Beyond resume screening: The transformative power of AI to match talent, reduce bias, and save time.

2 months, 4 weeks назад @ smartdatacollective.com
AI Video Surveillance for Safer Businesses
AI Video Surveillance for Safer Businesses

Discover how artificial intelligence helps businesses detect threats faster and protect people, property, and profits.

3 months назад @ smartdatacollective.com
Recurring Revenue Strategies for the AI Business Era
Recurring Revenue Strategies for the AI Business Era

Learn how subscriptions and usage-based pricing help AI companies create steady income, manage costs, and keep customers engaged over time.

3 months, 1 week назад @ smartdatacollective.com
How AI Supports Modern Penetration Testing
How AI Supports Modern Penetration Testing

Smart Data Collective has spent years talking about various ways busineses can use AI to help manage risks and make real-world decisions. Today we are going to talk about how AI-driven tools change the way testing is planned, executed, and reviewed. There are many reasons businesses are reevaluating how they test their systems as threats […]

3 months, 1 week назад @ smartdatacollective.com
How Data Analytics Can Help You Construct A Financial Weather Map
How Data Analytics Can Help You Construct A Financial Weather Map

See the financial forecast: Using data analytics to map economic trends and prepare your business.

4 months назад @ smartdatacollective.com
AI Shows How Payment Delays Disrupt Your Business
AI Shows How Payment Delays Disrupt Your Business

More than a cash flow problem: How AI analytics shows the true cost of payment delays on your business.

4 months назад @ smartdatacollective.com
Knoldus
последний пост None
We Cloud Data We Cloud Data
последний пост 3 days, 20 hours назад
Designing a Custom AI Training Program for Legal and Compliance Teams
Designing a Custom AI Training Program for Legal and Compliance Teams

Everyone is talking about AI efficiency, but in a corporate legal or compliance department, a single unverified AI output can lead to severe consequences. If an AI tool hallucinates a case citation, leaks a privileged document to a public training set, or fails to spot a non-compliance clause, the cost isn’t just a bad draft—it’s […]

The post Designing a Custom AI Training Program for Legal and Compliance Teams appeared first on WeCloudData.

3 days, 20 hours назад @ weclouddata.com
Understanding AI for Law and Legal Regulatory Affairs
Understanding AI for Law and Legal Regulatory Affairs

In 2026, the legal and regulatory landscape is moving faster than ever. Legal departments and compliance teams are currently facing a “quadruple threat”: a massive surge in document volume, a 500% increase in global regulatory changes over the last decade, constant pressure to improve operational efficiency, and the non-negotiable need to maintain strict data governance […]

The post Understanding AI for Law and Legal Regulatory Affairs appeared first on WeCloudData.

1 week, 2 days назад @ weclouddata.com
RAG vs. CAG: Choosing the Right Data Strategy
RAG vs. CAG: Choosing the Right Data Strategy

In the rapidly evolving landscape of generative AI, the biggest challenge isn’t just getting an LLM to talk—it’s getting it to talk accurately about your data. For the past two years, Retrieval-Augmented Generation (RAG) has been the gold standard for connecting AI to external data. However, a new contender has emerged: Cache-Augmented Generation (CAG). While […]

The post RAG vs. CAG: Choosing the Right Data Strategy appeared first on WeCloudData.

2 weeks, 2 days назад @ weclouddata.com
The Essential AI Toolkit for 2026
The Essential AI Toolkit for 2026

Building a comprehensive AI toolkit for 2026 is less about finding a single “best” app and more about curating a stack that handles research, execution, and specialized workflows. For those looking to master these technologies, this guide categorizes the essential top AI tools list currently shaping the industry. 1. AI tools for Research: Text, Reasoning, […]

The post The Essential AI Toolkit for 2026 appeared first on WeCloudData.

3 weeks, 2 days назад @ weclouddata.com
How AI Is Changing K–12 Classrooms
How AI Is Changing K–12 Classrooms

The modern K–12 classroom is at a crossroads. Walk down any hallway, and you’ll see the tension: students are already using AI tools for students to draft essays, while many educators feel the pressure to either “police” the tech or ignore it. But here is the reality for 2026: AI for teachers K-12 isn’t about […]

The post How AI Is Changing K–12 Classrooms appeared first on WeCloudData.

1 month назад @ weclouddata.com
Transforming Schools with Scalable AI
Transforming Schools with Scalable AI

You’ve read the headlines: educators saving six weeks a year, grading workloads slashed by 37%, dropout rates falling. But there’s a gap between knowing AI works and knowing how to deploy it across an entire institution — without chaos, compliance headaches, or teachers left behind. If you’re a curriculum director, VP of Academic Affairs, or […]

The post Transforming Schools with Scalable AI appeared first on WeCloudData.

1 month, 1 week назад @ weclouddata.com
Reclaiming time in Education Classrooms & Reimaging Learning
Reclaiming time in Education Classrooms & Reimaging Learning

For most teachers, the “dream of teaching” often hits a wall of reality: 10:00 PM grading sessions, the endless hunt for differentiated materials, and a growing mountain of administrative emails. You didn’t enter this profession to be a data entry clerk; you joined it to inspire students. As we track the latest AI in education […]

The post Reclaiming time in Education Classrooms & Reimaging Learning appeared first on WeCloudData.

1 month, 2 weeks назад @ weclouddata.com
Building the Future of Connectivity: AI in Telecommunications
Building the Future of Connectivity: AI in Telecommunications

The telecommunications industry is undergoing a massive transformation. With the rise of 5G, IoT, and connected devices, telecom companies are managing unprecedented volumes of data and network complexity. This is where Artificial Intelligence in telecommunication becomes critical. From optimizing network performance to improving customer experience, AI in telecom is enabling providers to move from reactive […]

The post Building the Future of Connectivity: AI in Telecommunications appeared first on WeCloudData.

1 month, 3 weeks назад @ weclouddata.com
Understanding AI in Banking and Finance
Understanding AI in Banking and Finance

In 2026, the financial sector has moved past the “experimentation” phase. We are now in the era of applied AI in banking and finance, where the difference between a market leader and a laggard is defined by how effectively they orchestrate intelligent systems. Whether you are a retail banker, a hedge fund analyst, or a […]

The post Understanding AI in Banking and Finance appeared first on WeCloudData.

1 month, 4 weeks назад @ weclouddata.com
The Strategic Role of AI in Tourism and Entertainment
The Strategic Role of AI in Tourism and Entertainment

The world of travel and fun is changing fast. People no longer want boring brochures or fixed plans; today’s travelers expect quick, personal service that used to be impossible. This change is happening because of smart technology that connects what people want with the data to make it happen. For businesses, understanding the impact of […]

The post The Strategic Role of AI in Tourism and Entertainment appeared first on WeCloudData.

2 months, 2 weeks назад @ weclouddata.com
Semantic Communication Stack: Beyond Generative Copywriting in 2026
Semantic Communication Stack: Beyond Generative Copywriting in 2026

In the early 2020s, the conversation around AI for communications professionals was dominated by a single, narrow use case: “Can it write an article for me?” By 2026, that question has become obsolete. The industry has moved past the novelty of generative copywriting and entered the era of the Semantic Communication Stack. As global information […]

The post Semantic Communication Stack: Beyond Generative Copywriting in 2026 appeared first on WeCloudData.

2 months, 3 weeks назад @ weclouddata.com
AI in Agriculture: Transforming Farming Through Data, Intelligence, and Practical Skills
AI in Agriculture: Transforming Farming Through Data, Intelligence, and Practical Skills

Agriculture is entering a new technological era. As global populations grow and global foodwater scarcity intensifies, traditional farming methods alone can no longer sustain rising food production demands while minimizing environmental impact. Artificial intelligence is emerging as a critical solution — helping farmers, agribusinesses, and policymakers make smarter, faster, and more sustainable decisions. From predicting […]

The post AI in Agriculture: Transforming Farming Through Data, Intelligence, and Practical Skills appeared first on WeCloudData.

2 months, 4 weeks назад @ weclouddata.com
AI for Project Managers: Reimagining Traditional Project Management
AI for Project Managers: Reimagining Traditional Project Management

In the world of project management, there is a “silent thief” that no one likes to talk about. It’s not a missed deadline or a budget overrun. It’s the administrative burden. If you’re a Project Manager, you know the feeling. You spend 60% of your week in a cycle of “information chasing”: summarizing meeting notes, […]

The post AI for Project Managers: Reimagining Traditional Project Management appeared first on WeCloudData.

3 months, 1 week назад @ weclouddata.com
Building the Foundation for AI-Driven Research
Building the Foundation for AI-Driven Research

We have entered a new era of work. Information is no longer hard to find; it is everywhere. In fact, by 2025, over 1.2 billion websites exist, and hundreds of thousands of new pages are created every single day. For anyone in a research-heavy role whether you are an analyst, a student, or a strategist—the […]

The post Building the Foundation for AI-Driven Research appeared first on WeCloudData.

3 months, 2 weeks назад @ weclouddata.com
Saudi AI Vision 2030: Leading the Future of Artificial Intelligence
Saudi AI Vision 2030: Leading the Future of Artificial Intelligence

The global race for technological supremacy has a new, formidable frontrunner: Saudi Arabia. As the Kingdom undergoes a historic transformation, the Saudi AI Vision 2030 has emerged as the heartbeat of its digital evolution. This isn’t just a tech upgrade; it’s a fundamental reimagining of a nation’s future. It’s shifting from an oil-dependent economy to […]

The post Saudi AI Vision 2030: Leading the Future of Artificial Intelligence appeared first on WeCloudData.

3 months, 3 weeks назад @ weclouddata.com
Learn Data Engineering
последний пост None
SCRIBD
последний пост 3 months назад
Dual-Embedding Trust Scoring
Dual-Embedding Trust Scoring Dual-Embedding Trust Scoring

Scribd is a digital library serving academics and lifelong learners, offering hundreds of millions of documents. This very nature presents a significant concern: content trust and safety. Protecting our library from undesirable and unsafe content is a top priority, but the multilingual and multimodal (text and images) nature of our platform makes this mission very challenging. Also, while third-party tools exist, they often fall short, lacking the nuance to handle our specific trust and safety categories.

To this end, we capitalized on Generative AI (GenAI) signals and our proprietary multilingual embeddings, in conjunction with classical machine learning methods, to develop our Content Tru…

3 months назад @ tech.scribd.com
Screaming in the Cloud
Screaming in the Cloud

Scribd has absolutely fascinating data-at-scale type problems, all the way

down to the fundamentals of how we use AWS S3. In my previous

post I wrote about the design of Content

Crush and how Scribd is consolidating objects in S3 to minimize our costs.

Related to that work I was fortunate enough to join the (in)famous Corey

Quinn to talk about Engineering around Extreme S3 scale:

Checking if files are damaged? $100K. Using newer S3 tools? Way too expensive.

Normal solutions don’t work anymore. Tyler shares how with this much data, you

can’t just throw money at the problem, but rather you have to engineer your way

out.

You can also listen

On Everand

or watch via the Last Week in AWS YouTube …

3 months, 2 weeks назад @ tech.scribd.com
Deploying a Cost-Effective, Scalable PhotoDNA System for CSAM Detection
Deploying a Cost-Effective, Scalable PhotoDNA System for CSAM Detection Deploying a Cost-Effective, Scalable PhotoDNA System for CSAM Detection

Child safety is a non‑negotiable responsibility for any platform that hosts user‑generated content. Over the last year, we designed and deployed a production system that detects known Child Sexual Abuse Material (CSAM) using PhotoDNA perceptual hashes, integrates with the National Center for Missing and Exploted Children’s (NCMEC) reporting system, and scales efficiently across our ingestion surfaces. This post explains the problem we set out to solve, how PhotoDNA hashing works, the online child-protection ecosystem (NCMEC, Tech Coalition, Project Lantern), our architecture and operational model, cost considerations, and key learnings.

Note: This article discusses safety technology at a hi…

4 months, 1 week назад @ tech.scribd.com
Supercharging S3 Intelligent Tiering with Content Crush
Supercharging S3 Intelligent Tiering with Content Crush Supercharging S3 Intelligent Tiering with Content Crush

Scribd and Slideshare have been using AWS S3 for almost twenty years and

store hundreds of billions of objects making storage management quite a

challenge. My focus at Scribd has generally been around data and storage but

only in the past twelve months have I started to really focus on one of our

hardest technology problems: cost-effective storage and availability for the

hundreds of billions of objects that represent our content library.

Since adopting S3 for our object storage in 2007 a lot has changed with the service, most

notably Intelligent

Tiering which was

introduced in

2018.

At a very high level Intelligent Tiering allows object access patterns to

dictate the storage tier for a sma…

4 months, 2 weeks назад @ tech.scribd.com
Don’t hardcode IAM credentials in GitHub!
Don’t hardcode IAM credentials in GitHub! Don’t hardcode IAM credentials in GitHub!

Scribd deploys a lot of code from GitHub to AWS using GitHub Actions, which

means many of our Actions need to access AWS resources. Managing AWS API keys

and tokens for different IAM users is time-consuming, brittle, and insecure.

Managing key-distribution between AWS and GitHub also makes it difficult to

track which keys go where, when they should be rotated, and what permissions

those keys have. Fortunately AWS supports creating OpenID Connect identity

providers

which is an ideal tool handle this kind of cross-cloud authentication in a more

maintainable way.

From the AWS documentation: IAM OIDC identity providers are entities in IAM that describe an external

identity provider (IdP) servic…

4 months, 3 weeks назад @ tech.scribd.com
Building a Scalable Data Warehouse Backup System with AWS
Building a Scalable Data Warehouse Backup System with AWS Building a Scalable Data Warehouse Backup System with AWS

We designed and implemented a scalable, cost-optimized backup system for S3 data warehouses that runs automatically on a monthly schedule. The system handles petabytes of data across multiple databases and uses a hybrid approach: AWS Lambda for small workloads and ECS Fargate for larger ones.

At its core, the pipeline performs incremental backups — copying only new or changed parquet files while always preserving delta logs — dramatically reducing costs and runtime compared to full backups. Data is validated through S3 Inventory manifests, processed in parallel, and stored in Glacier for long-term retention.

To avoid data loss and reduce storage costs, we also implemented a safe deletion wo…

8 months, 1 week назад @ tech.scribd.com
Data Quest
последний пост None
Infrastructure
AWS
последний пост 17 часов назад
Training Azerbaijani language models on Amazon SageMaker AI
Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom LLC, Azerbaijan's leading telecommunications provider, wanted to build an Azerbaijani large language model (LLM) on Amazon SageMaker AI for telecom use cases and a customer-facing chatbot. The challenge: adapting foundation models (FMs) to a morphologically rich language with limited training data and no existing blueprint for efficient LLM training in Azerbaijani. In a six-week collaboration, Azercell worked with the AWS Generative AI Innovation Center to establish a production-ready framework on Amazon SageMaker AI.

17 часов назад @ aws.amazon.com
Build a custom portal with embedded Amazon SageMaker AI MLflow Apps
Build a custom portal with embedded Amazon SageMaker AI MLflow Apps

In this post, you learn how to build a custom portal with embedded SageMaker AI MLflow Apps UI. You walk through the architecture pattern behind a React front end paired with a Flask reverse proxy that handles AWS Signature Version 4 (SigV4) authentication, deploy the entire stack through the AWS Cloud Development Kit (AWS CDK), validate the deployment, and review security considerations and cleanup procedures.

18 часов назад @ aws.amazon.com
Streamline external access to Amazon SageMaker MLflow using a REST API proxy
Streamline external access to Amazon SageMaker MLflow using a REST API proxy

In this post, we demonstrate how to build a secure Flask-based MLflow proxy service that provides HTTPS access to Amazon SageMaker MLflow without requiring the MLflow SDK. This solution is for organizations undergoing cloud transformation who want to preserve their existing ML workflows while adopting cloud-native services.

18 часов назад @ aws.amazon.com
Evaluating Deep Agents using LangSmith on AWS
Evaluating Deep Agents using LangSmith on AWS

This post combines learnings from LangChain’s work on evaluating deep agents and Anthropic’s guide to demystifying evals for AI agents into a practical guide. In this post, you will learn how to: 1) apply five evaluation patterns for deep agents, 2) build offline evaluations using pytest and LangSmith, and 3) configure online monitoring for production. The walkthrough uses a text-to-SQL deep agent with Amazon Bedrock for the full development to production lifecycle.

18 часов назад @ aws.amazon.com
The next generation of Amazon OpenSearch Serverless: Built from the ground up for agents
The next generation of Amazon OpenSearch Serverless: Built from the ground up for agents

Today, we are announcing a ground-up re-architecture of Amazon OpenSearch Serverless that delivers up to 20 times faster autoscaling, scale to zero, and up to 60% lower cost than provisioning clusters for peak load. Amazon OpenSearch Service is a fully managed, open source retrieval engine that unifies vector, lexical, hybrid, and agentic search, delivering low-latency, accurate and relevant results. Amazon OpenSearch Serverless is an automatically scaled deployment option. The new architecture decouples compute from storage. The service provisions infrastructure in seconds instead of minutes, and scales compute all the way to zero when your application is idle. In this post, we walk throug…

20 часов назад @ aws.amazon.com
Build a test suite that grows with your agent with dataset management in Amazon Bedrock AgentCore
Build a test suite that grows with your agent with dataset management in Amazon Bedrock AgentCore

Agent evaluation is most powerful when you combine fast-moving online signals with stable offline baselines. To understand whether your agent is truly improving over time, you need a fixed benchmark alongside your changing real-world traffic. Managing test cases for evaluation baselines as a dataset in Amazon Bedrock AgentCore brings the discipline of versioned test fixtures […]

21 час назад @ aws.amazon.com
Claude Opus 4.8 is now available on AWS
Claude Opus 4.8 is now available on AWS

This post covers Opus 4.8's improvements and practical guidance for AI engineers integrating the model into agentic systems and production inference workloads on Amazon Bedrock.

21 час назад @ aws.amazon.com
Automate AML alert triage with Amazon Quick and Snowflake Cortex AI
Automate AML alert triage with Amazon Quick and Snowflake Cortex AI

This post demonstrates that integration in action by automating one of the most labor-intensive workflows in financial services: anti-money laundering (AML) alert triage. You will build a triage workflow using Amazon Quick Flows and Snowflake Cortex, connected through the Amazon Quick Model Context Protocol (MCP) integration. In our testing environment, automated workflows built using Amazon Quick reduced alert investigation time from 30-90 minutes to under 5 minutes. Actual results may vary based on alert complexity and data volume.

22 часа назад @ aws.amazon.com
Guide your Amazon Aurora MySQL migration with Kiro powers
Guide your Amazon Aurora MySQL migration with Kiro powers

Today, we announce the Amazon Aurora MySQL power for Kiro. The power connects Kiro’s AI agent to Aurora MySQL and pairs live database access with curated best-practice guidance. You describe what you need in natural language. The agent generates the API calls, SQL, and configuration for you to review and run. In this post, we walk through how the power guides a production migration from Amazon Relational Database Service (Amazon RDS) for MySQL 8.0 to Aurora MySQL through four phases: assessment, replica creation, promotion, and post-cutover validation.

1 day, 14 hours назад @ aws.amazon.com
AI-native, full-stack web apps with Vercel and AWS Databases
AI-native, full-stack web apps with Vercel and AWS Databases

In this post, we show how the integration between Vercel and AWS Databases solves this and invite you to participate in the H0 hackathon.

1 day, 16 hours назад @ aws.amazon.com
Process financial documents using Amazon Bedrock Data Automation
Process financial documents using Amazon Bedrock Data Automation

In this post, we explore how Amazon Bedrock Data Automation can accurately extract information from four common types of financial documents: bank statements, W-2 forms, 1099-B tax forms, and vendor contracts. We highlight the complexity in the documents, detail the custom extraction created in Amazon Bedrock Data Automation, and describe the outcomes of the extraction process.

1 day, 17 hours назад @ aws.amazon.com
How AWS DevOps Agent uses multi-agent reasoning to find root causes
How AWS DevOps Agent uses multi-agent reasoning to find root causes

Confirmation bias is one of the most common reasons incident investigations take longer than they should. An on-call engineer gets alerted, forms a theory based on initial triage and experience, finds one piece of supporting evidence, and stops looking. The actual root cause — buried in a different service, a different signal, a different time […]

1 day, 19 hours назад @ aws.amazon.com
Building AI agents for business support using Amazon Bedrock AgentCore
Building AI agents for business support using Amazon Bedrock AgentCore

In this post, we share how the AWS Generative AI Innovation Center (GenAIIC) collaborated with Works Human Intelligence (WHI) to build two AI agents using Amazon Bedrock AgentCore. We discuss the challenges encountered and the solutions that reduced costs by up to 97% while improving operational efficiency.

1 day, 19 hours назад @ aws.amazon.com
From data overload to actionable insights: How Verizon Connect scaled agentic AI to 100,000 users
From data overload to actionable insights: How Verizon Connect scaled agentic AI to 100,000 users

In this post, we show you how Verizon Connect built and scaled an agentic AI solution to transform overwhelming fleet data into clear, actionable insights for 100,000 users daily. We walk you through the architectural decisions, implementation challenges, and measurable results that can guide your own data-to-insights transformation.

1 day, 19 hours назад @ aws.amazon.com
How AWS SMGS uses an AI-powered conversational assistant to transform business management with Amazon Bedrock AgentCore
How AWS SMGS uses an AI-powered conversational assistant to transform business management with Amazon Bedrock AgentCore

In this post, we share how we built NarrateAI using Amazon Bedrock AgentCore to deliver business intelligence at scale for the AWS SMGS (Sales, Marketing and Global Services) organization. You will learn about: the two-layer architecture that separates batch processing from real-time interaction, the specialized AI agents that power intelligent routing and validation, key engineering patterns for production deployment, and how to build similar solutions with AWS services.

1 day, 20 hours назад @ aws.amazon.com
AWS
последний пост 17 часов назад
How Buildkite Operates Test Analytics at Massive Scale with Amazon MSK and Amazon Managed Service for Apache Flink
How Buildkite Operates Test Analytics at Massive Scale with Amazon MSK and Amazon Managed Service for Apache Flink

In this post, we explore how Buildkite uses Amazon Managed Streaming for Apache Kafka (Amazon MSK) and Amazon Managed Service for Apache Flink to power Test Engine’s streaming-first analytics architecture at scale.

1 day, 20 hours назад @ aws.amazon.com
How Zynga scaled multi-warehouse data governance with Amazon Redshift federated permissions
How Zynga scaled multi-warehouse data governance with Amazon Redshift federated permissions

In this post, we walk through how Zynga adopted Amazon Redshift federated permissions and AWS IAM Identity Center to enforce consistent, tiered data access across provisioned and serverless Amazon Redshift environments without building custom synchronization pipelines.

1 day, 20 hours назад @ aws.amazon.com
Real-time personalized recommendations with Amazon SageMaker and Amazon-managed Valkey
Real-time personalized recommendations with Amazon SageMaker and Amazon-managed Valkey

Amazon receives millions of visits every day, and earning each customer’s trust visit after visit is the foundation that the store is built on. A meaningful part of that trust comes down to whether the recommendations we surface feel relevant and whether they reflect what the customer actually cares about in the moment. In this post, we describe an architecture that makes it achievable. Amazon SageMaker hosts a sentence transformer model on a managed endpoint and turns customer query text into dense semantic vectors. Valkey is an open source, in-memory data store with built-in vector search. It’s available on AWS through Amazon ElastiCache and Amazon MemoryDB. In our architecture, we use Am…

1 day, 20 hours назад @ aws.amazon.com
Optimize costs in Amazon Aurora
Optimize costs in Amazon Aurora

By implementing modern optimization techniques for Aurora, you can achieve additional cost reduction beyond traditional methods alone. This isn’t only about spending less—it’s about building a more efficient, scalable, and resilient database environment. In this post, we show you a structured approach to optimizing Amazon Aurora database costs. It outlines specific strategies, implementation steps, and best practices across different optimization areas.

1 day, 20 hours назад @ aws.amazon.com
Powering agentic AI sales strategy with Amazon Bedrock AgentCore
Powering agentic AI sales strategy with Amazon Bedrock AgentCore

As agent adoption scaled, we saw a common pattern emerge across enterprises, including our own sales organization: specialized agents deliver value, but without orchestration, users carry the cognitive load of choosing between them. At AWS Sales, this meant more than 20 domain-specific agents deployed across the global organization, with representatives context-switching between systems instead of […]

1 day, 21 hours назад @ aws.amazon.com
Automate data discovery and centralized management with AWS Glue Data Catalog
Automate data discovery and centralized management with AWS Glue Data Catalog

In this post, we show you how to tackle data discovery, classification, and governance across your databases, data warehouses, and object storage to regain visibility and control over your data landscape.

2 days, 21 hours назад @ aws.amazon.com
Preserving custom domain names for Amazon RDS for Db2
Preserving custom domain names for Amazon RDS for Db2

In this post, we introduce a modular Terraform template, published in the aws-samples/sample-rds-db2-tools repository, that lets your applications keep their existing custom domain names and ports while preserving end-to-end TLS encryption to Amazon RDS for Db2. The template deploys a Server Name Indication (SNI) based TLS proxy that forwards encrypted traffic without ever decrypting it.

2 days, 21 hours назад @ aws.amazon.com
Technical deep dive: AgentCore payments and innovation in agentic commerce
Technical deep dive: AgentCore payments and innovation in agentic commerce

Amazon Bedrock AgentCore payments is now available in preview, it provides instant payments to paid external services with no manual billing setup per provider, stablecoin support for cost-effective microtransactions that make sub-cent transactions economically viable, and configurable spending guardrails that give you fine-grained control over agent budgets and transaction limits. In this post, we walk you through a technical deep dive of AgentCore payments.

2 days, 21 hours назад @ aws.amazon.com
Build highly scalable serverless LangGraph multi-agent systems in AWS with Amazon Bedrock AgentCore
Build highly scalable serverless LangGraph multi-agent systems in AWS with Amazon Bedrock AgentCore

In this post, we provide a solution to build highly scalable, serverless multi-agent generative AI systems on AWS using LangGraph Agents as orchestrators integrated with Amazon Bedrock AgentCore Memory and Amazon Bedrock AgentCore Observability.

2 days, 21 hours назад @ aws.amazon.com
Build high-performance generative AI systems with Strands Agents, NVIDIA NIM, and Amazon Bedrock AgentCore
Build high-performance generative AI systems with Strands Agents, NVIDIA NIM, and Amazon Bedrock AgentCore

In this post you'll learn how to build a multi-agent campaign review system that demonstrates parallel reasoning, context persistence, and traceable execution paths using an integrated architecture that combines NVIDIA NIM for GPU-accelerated inference. Amazon Bedrock AgentCore provides managed runtime, shared memory and built-in observability and Strands Agents provide serverless multi-agent orchestration. This approach supports performance, scalability, and operational insight in production environments. While the example focuses on marketing content review, the same pattern applies to digital assistants, review automation, and retrieval-augmented generation pipelines.

2 days, 21 hours назад @ aws.amazon.com
AgentWatch: Proactive AWS monitoring with ambient agents
AgentWatch: Proactive AWS monitoring with ambient agents

In this post, we demonstrate the capabilities of AgentWatch through practical implementation. You will see how the solution performs infrastructure checks every 15 minutes, summarizing CloudWatch metrics, logs, and alarms across multiple AWS accounts. The agent delivers actionable reports directly to Slack and responds to natural language queries about your infrastructure state. Throughout, we explore three human-in-the-loop patterns that maintain appropriate oversight while maximizing automation.

2 days, 21 hours назад @ aws.amazon.com
From idea to AI app: Creating intelligent research assistants with Strands
From idea to AI app: Creating intelligent research assistants with Strands

Building an AI app shouldn’t require a PhD in machine learning (ML) or months of wrestling with complex architectures. Yet that’s exactly what happens when you try to orchestrate multiple API calls, manage conversation state, and create agents that can reason on their own. I’ve seen straightforward AI ideas balloon into sprawling projects that demand […]

2 days, 22 hours назад @ aws.amazon.com
Build an enterprise observability solution for Amazon Quick
Build an enterprise observability solution for Amazon Quick

When hundreds to thousands of users are onboarded to an enterprise AI platform, business leaders and platform owners need visibility into who is using the platform, whether users are satisfied with the answers they receive, and which capabilities are driving the most engagement. Without a centralized observability solution, this data is scattered across multiple AWS […]

2 days, 23 hours назад @ aws.amazon.com
Transforming professional work: How Amazon Quick turns document creation from hours into minutes
Transforming professional work: How Amazon Quick turns document creation from hours into minutes

In this post, we explore how the Amazon Quick document and visualization creation capabilities work, what you can build with them, and how professionals across roles are using them to reclaim hours of their workweek. From technical execution to strategic judgment Most professional roles carry an unspoken assumption that a significant portion of your time […]

2 days, 23 hours назад @ aws.amazon.com
How Amazon is moving to integrate catalogs to improve data discovery with Amazon SageMaker
How Amazon is moving to integrate catalogs to improve data discovery with Amazon SageMaker

Enterprises face challenges when teams create data assets outside of central data catalogs. It adds overhead for discovery, and limits collaboration. Amazon’s Business Data Technologies (BDT) team has built an enterprise data catalog Andes for sharing datasets under well-defined policies. However, teams created catalog of local datasets and other non-tabular assets such as dashboards and metrics, outside Andes. This made it difficult to discover all assets in a consolidated way. In this post, we share how Amazon.com is working to integrate catalogs by extending enterprise data catalog Andes with Amazon SageMaker.

6 days, 18 hours назад @ aws.amazon.com
Astronomer Astronomer
последний пост None
DBT — Data Build Tool DBT — Data Build Tool
последний пост None
FiveTran FiveTran
последний пост None
DataBricks
последний пост None
Mix
/r/DataEngineering
последний пост 1 час назад
amplitude pricing went up at renewal, trying to figure out if I crossed a tier
amplitude pricing went up at renewal, trying to figure out if I crossed a tier

Renewal came in higher and the explanation was vague. before I negotiate or move I want to understand whether this is structural (we crossed a tier) or just pricing inflation. what I'm trying to figure out: the actual shape of the cost model, what's negotiable, where teams have flattened the curve without losing funnels and retention. mobile, ~5M monthly events, team of 3. submitted by /u/ProfessionalSlow414 [link] [comments]

1 час назад @ reddit.com
Getting Salesforce data ready for AI analytics?
Getting Salesforce data ready for AI analytics?

Currently we simply have our Salesforce objects/tables available in BigQuery and keep that structure basically intact. I inherited from the guy that was here before me and it works fine for our setup. We just create tables for our dashboards in Data Studio (which likes OBT). Big advantage is that we can easily see what causes differences between Reports in Salesforce and our dashboards because the underlying structure is the same. But now we are looking getting our data ready for an AI Agent. I'm currently experimenting with using the column descriptions in BigQuery, sample queries and synonyms using BigQuery's built-in agent builder. It seems to work ok, but not as good as I want. Probably…

3 часа назад @ reddit.com
Interesting Links in Data Engineering (May 2026)
Interesting Links in Data Engineering (May 2026)

It May be time … for the May edition of Interesting Links :) There's more Kafka than usual this month for some reason, plus a HN hit, a new Iceberg release, data modelling advice (and just a bit of shitposting too). https://rmoff.net/2026/05/28/interesting-links-may-2026/ submitted by /u/rmoff [link] [comments]

3 часа назад @ reddit.com
New Azure role, first client assignment is a mismatch (Data Engineering instead of Software Engineering). How to handle during probation?
New Azure role, first client assignment is a mismatch (Data Engineering instead of Software Engineering). How to handle during probation?

I recently started at a new Azure cloud consulting company as an Senior Cloud Engineer. The company itself seems fine so far, but my first client assignment feels misaligned. Before joining, I expected work closer to Azure Integration Services, DevOps and architecture. In practice, the assignment is mostly Azure Data Factory, ETL/data engineering, complex data flows and maintenance. On top of that, there is budget pressure from the project side. I’ve been told I’m using too many hours and should deliver faster, while I’m already putting in serious effort. Part of the issue is that the work does not fully match my strongest skillset. I’m still in probation and I’m considering three options: …

16 часов назад @ reddit.com
Well played Dagster
Well played Dagster Well played Dagster

submitted by /u/blu_lazr [link] [comments]

19 часов назад @ reddit.com
Help with Old Scala Pipeline integration with DataHub ( with no existing store for metadata other than normal field name + type)
Help with Old Scala Pipeline integration with DataHub ( with no existing store for metadata other than normal field name + type)

So... currently we're trying to integrate with DataHub to use as our catalog. The issue is that we don't HAVE any metadata (other than obvious field names and types), there is literally no place where we're storing in any way shape or form things like descriptions or tags or really anything like that for any of the data sets and fields anywhere in the pipeline. Of course we could just manually create these artifacts/files for consumption in DataHub OR we could author them IN DataHub... but that doesn't seem like it's the best option here. The closest thing we have are Scala case classes used during transformations and outputs. This is the only thing REMOTELY close to something even resembli…

20 часов назад @ reddit.com
Are weekend support hours common in this field? Like log on, check that it's running, and fix errors if it's not?
Are weekend support hours common in this field? Like log on, check that it's running, and fix errors if it's not?

If so, how often does weekend support happen? If any, how much more do those roles pay? submitted by /u/nigelwiggins [link] [comments]

21 час назад @ reddit.com
We built a blazing fast Clickhouse® Cloud alternative
We built a blazing fast Clickhouse® Cloud alternative

Hey, Marc here, Co-Founder of ObsessionDB. I think we built some pretty cool stuff in the last months and my colleagues urge me to share a bit out of the engineering kitchen. We're a drop-in replacement for Clickhouse® Cloud with an api-compatible SharedMergeTree table engine, with compute-storage (S3) and compute-compute separation, plus some extra special sauce. Specifically the latter kills quite some headaches we know from our experience with Clickhouse Cloud, like cold starts, inconsistent and slow query times due to the S3 latency penalty and the 1/N probability of a cache hit or a neglectable cache size at scale. We focused a lot on the "looks great in the lab benchmark, but fails in…

22 часа назад @ reddit.com
Minarrow: a lightweight Arrow-shaped columnar data library for Rust
Minarrow: a lightweight Arrow-shaped columnar data library for Rust

Minarrow is a columnar data library for Rust. What: Apache Arrow is the columnar run-time that backs major libraries like Polars, Apache Data Fusion, and optionally in Pandas. Minarrow is a from-scratch implementation of the open Arrow format. The pitch: Arrow-shaped data with Python-style ergonomics, Rust-level safety, and fast builds. It sits as the backing run-time for data libraries, or engineers that like to start with something minimal for working with data in Rust. Benefit: strong typing and a compiler that agents like Claude can fall back on when iterating on a data pipeline to receive real-time feedback during development for self-diagnosis and improvement loops. Why? I built it af…

1 day, 1 hour назад @ reddit.com
Nikola Ilic - Data Modeling for Analytics Engineers: The Complete Primer
Nikola Ilic - Data Modeling for Analytics Engineers: The Complete Primer Nikola Ilic - Data Modeling for Analytics Engineers: The Complete Primer

submitted by /u/rmoff [link] [comments]

1 day, 3 hours назад @ reddit.com
LLM Analytics in Enterprises?
LLM Analytics in Enterprises?

Hi folks Im curious to understand if and how teams are building their LLM analytics for internal usage across different organisations. Additionally, how would you test to ensure theres low hallucinations etc. For example in my team (small organisation <50 people), we built an MCP server that runs on Cloudflare workers. We then have our main MCP client which is Claude that connects to that MCP. We have developed many skills and amongst it is a data warehouse skill which contains knowledge.md and skills.md files to describe the data warehouse. Those md files essentially are our semantic layer. We have some test coverage by domain which we try to evaluate desired sql outputs based on sample qu…

1 day, 4 hours назад @ reddit.com
Self-hosted iPaaS on Kubernetes, any recommendations?
Self-hosted iPaaS on Kubernetes, any recommendations?

Hi everyone, For my company, we’re looking for an iPaaS solution that we must self-host for security reasons. The goal is to provide a platform that allows developers to build data pipelines and expose APIs. Do you know of any iPaaS solutions that can be self-hosted, and ideally deployed on Kubernetes? submitted by /u/Plane_Expression2000 [link] [comments]

1 day, 5 hours назад @ reddit.com
Databricks DBU pricing is getting insane—Photon misconfiguration in a small POC caused a 5-digit cloud bill
Databricks DBU pricing is getting insane—Photon misconfiguration in a small POC caused a 5-digit cloud bill Databricks DBU pricing is getting insane—Photon misconfiguration in a small POC caused a 5-digit cloud bill

One of our dev teams in the POC was doing some runs using Job Compute, and we suddenly saw a spike in the cloud cost usage, and our cloud-finance team reported this. https://preview.redd.it/2harsa74nu3h1.png?width=705&format=png&auto=webp&s=dc55f864a4a7ebe420a3586619f67ede40ffc164 Two things to note here. Databricks by default has now enabled the photon option in Databricks, which the dev didnot see cuz it was not like that earlier, due to which the instances ran with Photon The cost clearly (from the image above) shows that the DBU pricing (48,805 INR) is literally more than 2x compared with the Azure Compute (23,000 INR) pricing. It looks like the Databricks License is getting extremely h…

1 day, 5 hours назад @ reddit.com
Unsure about my switch from Data
Unsure about my switch from Data

Hi everyone, how’s it going? I worked for 2 years as a Data Engineer in banking. I learned a lot, but there was too much bureaucracy and not enough actual coding, so I eventually decided to change jobs. Now I’m working on a legacy Java 8 project for the public sector. I’ve only been here for a month, and I have some doubts because I feel like it might not help me grow much professionally. They told me that later on the workload will decrease and I’ll have more time to study English and continue learning on my own. If in the future I want to move back into data, do you think this time working in backend / legacy Java could hurt my career prospects? Ideally, I see myself staying here for arou…

1 day, 6 hours назад @ reddit.com
Unravel Data launches autonomous optimization engine for Databricks, Snowflake and BigQuery
Unravel Data launches autonomous optimization engine for Databricks, Snowflake and BigQuery Unravel Data launches autonomous optimization engine for Databricks, Snowflake and BigQuery

Has anyone used this kind of optimization platform? Are they ever worth it? submitted by /u/mpuchala [link] [comments]

1 day, 10 hours назад @ reddit.com
Towards Data Science
последний пост 1 час назад
Explaining Lineage in DAX
Explaining Lineage in DAX

One of the most important concepts in DAX is lineage. It’s about the information on where something comes from. Let’s see what it is and how we can manipulate it.

The post Explaining Lineage in DAX appeared first on Towards Data Science.

1 час назад @ towardsdatascience.com
Five Questions About Chronos-2, the Time Series Foundation Model
Five Questions About Chronos-2, the Time Series Foundation Model

Part 1: A practitioner's walkthrough of univariate, multivariate, covariate-informed, and cold-start forecasting.

The post Five Questions About Chronos-2, the Time Series Foundation Model appeared first on Towards Data Science.

3 часа назад @ towardsdatascience.com
EmoNet: Speaker-Aware Transformers for Emotion Recognition — and What I’d Build Differently in 2026
EmoNet: Speaker-Aware Transformers for Emotion Recognition — and What I’d Build Differently in 2026

A retrospective on my MS thesis, the leaderboard it placed on, and the LLM shift that has reshaped the field since.

The post EmoNet: Speaker-Aware Transformers for Emotion Recognition — and What I’d Build Differently in 2026 appeared first on Towards Data Science.

22 часа назад @ towardsdatascience.com
The Infrastructure Behind Making Local LLM Agents Actually Useful
The Infrastructure Behind Making Local LLM Agents Actually Useful

Lessons from building a fast, reliable scientific agent with local open-weight models, vLLM, and long-context infrastructure

The post The Infrastructure Behind Making Local LLM Agents Actually Useful appeared first on Towards Data Science.

1 day назад @ towardsdatascience.com
Why AI Still Can’t Solve Your Real Mathematical Optimization Problem
Why AI Still Can’t Solve Your Real Mathematical Optimization Problem

And what ORPilot does differently

The post Why AI Still Can’t Solve Your Real Mathematical Optimization Problem appeared first on Towards Data Science.

1 day, 1 hour назад @ towardsdatascience.com
DiffuJudge-AV: A Diffusion-Inspired Framework for Calibrated AV Video Evaluation
DiffuJudge-AV: A Diffusion-Inspired Framework for Calibrated AV Video Evaluation

A diffusion-inspired framework for stress-testing and denoising LLM-as-a-Judge pipelines, applied to safety-critical driving video.

The post DiffuJudge-AV: A Diffusion-Inspired Framework for Calibrated AV Video Evaluation appeared first on Towards Data Science.

1 day, 3 hours назад @ towardsdatascience.com
How to Effectively Run Many Claude Code Sessions in Parallel
How to Effectively Run Many Claude Code Sessions in Parallel

Keep an overview of all your coding agents that run in parallel

The post How to Effectively Run Many Claude Code Sessions in Parallel appeared first on Towards Data Science.

1 day, 22 hours назад @ towardsdatascience.com
Learning From Pairwise Preferences: An Introduction to the Bradley Terry Model
Learning From Pairwise Preferences: An Introduction to the Bradley Terry Model

How to Turn Simple Head-to-Head Choices Into Probabilistic Rankings

The post Learning From Pairwise Preferences: An Introduction to the Bradley Terry Model appeared first on Towards Data Science.

2 days назад @ towardsdatascience.com
Most AI Agents Fail in Production Because They’re Built Backwards
Most AI Agents Fail in Production Because They’re Built Backwards

Good models don't save bad architecture, and most teams learn that the hard way.

The post Most AI Agents Fail in Production Because They’re Built Backwards appeared first on Towards Data Science.

2 days, 1 hour назад @ towardsdatascience.com
They Requested It. I Built It. Nobody Ever Used It.
They Requested It. I Built It. Nobody Ever Used It.

Why good data work gets ignored after delivery.

The post They Requested It. I Built It. Nobody Ever Used It. appeared first on Towards Data Science.

2 days, 3 hours назад @ towardsdatascience.com
What Is a Data Agent?
What Is a Data Agent?

A simple explanation of what a data agent is and how it works

The post What Is a Data Agent? appeared first on Towards Data Science.

2 days, 22 hours назад @ towardsdatascience.com
The AI Model Confidence Trap
The AI Model Confidence Trap

Why your AI model can be wrong with 99% confidence

The post The AI Model Confidence Trap appeared first on Towards Data Science.

3 days назад @ towardsdatascience.com
Stop Using LLMs Like Giant Problem Solvers
Stop Using LLMs Like Giant Problem Solvers

How I turned 100 messy pdfs into structured insights by building a deterministic loop around agents

The post Stop Using LLMs Like Giant Problem Solvers appeared first on Towards Data Science.

3 days, 1 hour назад @ towardsdatascience.com
The Domain Shift: Moving Data Governance from Product Triage to Infrastructure Investment
The Domain Shift: Moving Data Governance from Product Triage to Infrastructure Investment

How shifting the operational focus from isolated data products to systemic domain architecture resolves technical bottlenecks and optimizes platform investment.

The post The Domain Shift: Moving Data Governance from Product Triage to Infrastructure Investment appeared first on Towards Data Science.

3 days, 3 hours назад @ towardsdatascience.com
I Built My First ETL Pipeline as a Complete Beginner. Here’s How.
I Built My First ETL Pipeline as a Complete Beginner. Here’s How.

A beginner's honest walkthrough of Extract, Transform, Load using the GitHub API

The post I Built My First ETL Pipeline as a Complete Beginner. Here’s How. appeared first on Towards Data Science.

3 days, 21 hours назад @ towardsdatascience.com
DE Telegram
DataEng DataEng
последний пост 2 weeks, 1 day назад
Приглашаем вас на совместный вебинар AXENIX и вендора BR Systems, посвященный XLTable — OLAP‑системе с широким функционалом для работы с данными ClickHouse и Trino и поддержкой протокола XMLA в Excel.Эксперты подробно расскажут об XLTable и его основных пр
Приглашаем вас на совместный вебинар AXENIX и вендора BR Systems, посвященный XLTable — OLAP‑системе с широким функционалом для работы с данными ClickHouse и Trino и поддержкой протокола XMLA в Excel.Эксперты подробно расскажут об XLTable и его основных пр Приглашаем вас на совместный вебинар AXENIX и вендора BR Systems, посвященный XLTable — OLAP‑системе с широким функционалом для работы с данными ClickHouse и Trino и поддержкой протокола XMLA в Excel.Эксперты подробно расскажут об XLTable и его основных пр

Приглашаем вас на совместный вебинар AXENIX и вендора BR Systems, посвященный XLTable — OLAP‑системе с широким функционалом для работы с данными ClickHouse и Trino и поддержкой протокола XMLA в Excel.Эксперты подробно расскажут об XLTable и его основных преимуществах: быстроте внедрения, отсутствии дублирования данных, снижении затрат на TCO, бессрочной лицензии и других.В рамках вебинара вас ждет:🔸Обзор рынка OLAP-систем🔸Демо системы XL Table от BR Systems🔸Разбор реальных кейсов крупных компанийТакже у вас будет возможность задать свои вопросы.Для участия необходимо зарегистрироваться на сайте. На указанную вами почту придет ссылка на вебинар. Подключайтесь к нам 21 мая в 16:00.До встречи!…

2 weeks, 1 day назад @ t.me
PostgreSQL 16: Оптимизация запросов 🖥Вчера случайно заметил, что на Postgres Pro появилась новая книга PostgreSQL 16: Оптимизация запросов.Книга основана на курсе лекций про оптимизацию, который, к слову, также доступен бесплатно.Понравилось, что книга неб
PostgreSQL 16: Оптимизация запросов 🖥Вчера случайно заметил, что на Postgres Pro появилась новая книга PostgreSQL 16: Оптимизация запросов.Книга основана на курсе лекций про оптимизацию, который, к слову, также доступен бесплатно.Понравилось, что книга неб

PostgreSQL 16: Оптимизация запросов 🖥Вчера случайно заметил, что на Postgres Pro появилась новая книга PostgreSQL 16: Оптимизация запросов.Книга основана на курсе лекций про оптимизацию, который, к слову, также доступен бесплатно.Понравилось, что книга небольшая и без лишней воды, сразу приступает к делу без длительных прелюдий и философских размышлений.Рекомендую 🍻

4 weeks, 1 day назад @ t.me
Отказоустойчивость железа достигается через добавление избыточных компонентов, например, в системе может быть несколько жестких дисков, подключенных в режиме RAID-массива. В случае распределённых систем, запросы могут был равномерно распределены между неск
Отказоустойчивость железа достигается через добавление избыточных компонентов, например, в системе может быть несколько жестких дисков, подключенных в режиме RAID-массива. В случае распределённых систем, запросы могут был равномерно распределены между неск

Отказоустойчивость железа достигается через добавление избыточных компонентов, например, в системе может быть несколько жестких дисков, подключенных в режиме RAID-массива. В случае распределённых систем, запросы могут был равномерно распределены между несколькими независимыми машинами внутри дата-центра. Случается и так, что требуется отказоустойчивость на уровне дата-центра, тогда машины распределяют по нескольким физически независимым точкам (например, разные регионы AWS). Важно придерживаться здравого смысла и понимать какого уровня отказоустойчивости вам будет достаточно.Отказоустойчивость кода чуть сложнее. В первую очередь потому что один и тот же код может исполняться на большом пуле…

1 month назад @ t.me
Designing Data-Intensive ApplicationsГлава 2. Defining Nonfunctional RequirementsВторая глава книги посвящена нефункциональным требованиям к разрабатываемым нами системам. Под нефункциональными требованиями автор подразумевает:- Производительность (Perform
Designing Data-Intensive ApplicationsГлава 2. Defining Nonfunctional RequirementsВторая глава книги посвящена нефункциональным требованиям к разрабатываемым нами системам. Под нефункциональными требованиями автор подразумевает:- Производительность (Perform

Designing Data-Intensive ApplicationsГлава 2. Defining Nonfunctional RequirementsВторая глава книги посвящена нефункциональным требованиям к разрабатываемым нами системам. Под нефункциональными требованиями автор подразумевает:- Производительность (Performance)- Надёжность (Reliability) и отказоустойчивость (Fault Tolerance)- Масштабирование (Scalability)- Поддержка (Maintainability)Система может быть полностью корректна с точки зрения функциональных (т.н. бизнес) требований, но неудобна в использования из-за проблем с надёжностью (потеря данных), производительностью (частые “зависания” из-за нагрузки). Поэтому нефункциональным требованиям также необходимо уделять внимание.Мартин во второй …

1 month назад @ t.me
Эффективно управлять сложностью можно через абстракции. Например, через практики внедрения дизайн-паттернов, DDD, выбор более высокоуровневых технологий.РасширяемостьТребования к работе приложений меняются, а значит и оно само должно меняться. Чтобы внесен
Эффективно управлять сложностью можно через абстракции. Например, через практики внедрения дизайн-паттернов, DDD, выбор более высокоуровневых технологий.РасширяемостьТребования к работе приложений меняются, а значит и оно само должно меняться. Чтобы внесен

Эффективно управлять сложностью можно через абстракции. Например, через практики внедрения дизайн-паттернов, DDD, выбор более высокоуровневых технологий.РасширяемостьТребования к работе приложений меняются, а значит и оно само должно меняться. Чтобы внесение изменений не превратились в страшный сон необходимо постоянно пересматривать организацию кода, закрывать технический долг, внедрять непрерывное тестирование через практики TDD, XP. Чем проще вносить изменения в систему тем выше её расширяемость и тем ниже связность между её частями.

1 month назад @ t.me
Ребят, всем привет!Я не забыл про книгу, скоро будет конспект по второй главе (был перерыв). А пока я пишу конспект, то предлагаю вам насладиться подкастом с автором книги Designing Data-Intensive Applications Martin Kleppmann у Gergely Orosz — Designing D
Ребят, всем привет!Я не забыл про книгу, скоро будет конспект по второй главе (был перерыв). А пока я пишу конспект, то предлагаю вам насладиться подкастом с автором книги Designing Data-Intensive Applications Martin Kleppmann у Gergely Orosz — Designing D

Ребят, всем привет!Я не забыл про книгу, скоро будет конспект по второй главе (был перерыв). А пока я пишу конспект, то предлагаю вам насладиться подкастом с автором книги Designing Data-Intensive Applications Martin Kleppmann у Gergely Orosz — Designing Data-intensive Applications with Martin Kleppmann

1 month назад @ t.me
Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных дл
Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных дл Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных дл

Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных для хранения денег — MONEY. Как то так получилось, что не попадался он мне на глаза.Книга поделена на 4 части:— Modern SQL— Postgres for Full-Text Search (FTS)— Improper Data Type Usage— Table & Index MistakesСкачать книгу можно в комментариях к посту.

2 months, 3 weeks назад @ t.me
Cloud vs Self-HostedВечная дилемма что выбрать: использовать облачные сервисы или всё развернуть на своих серверах. Это снова вопрос компромиссов. У каждого подхода есть свои плюсы и минусы. Можно комбинировать два подхода и не уходить в крайности. Наприме
Cloud vs Self-HostedВечная дилемма что выбрать: использовать облачные сервисы или всё развернуть на своих серверах. Это снова вопрос компромиссов. У каждого подхода есть свои плюсы и минусы. Можно комбинировать два подхода и не уходить в крайности. Наприме

Cloud vs Self-HostedВечная дилемма что выбрать: использовать облачные сервисы или всё развернуть на своих серверах. Это снова вопрос компромиссов. У каждого подхода есть свои плюсы и минусы. Можно комбинировать два подхода и не уходить в крайности. Например, использовать виртуальную машину на AWS на которой хостить базу данных вместо использования managed-решения. Например, self-hosted PostgreSQL вместо Amazon RDS.Облачные сервисы избавляют команду от операционного управления, например, не нужно самостоятельно следить за обновлениями, патчами безопасности или высокой доступностью тех или иных сервисов. Порой вам даже не нужно думать о масштабировании, за вас это делает облачный провайдер. В…

2 months, 3 weeks назад @ t.me
Данные и законодательствоС развитием GDPR, CCPA, ,EU AI Act и прочих законодательных норм и правил по персональным данным появилась необходимость учитывать риск хранения и обработки этих данных. В какой-то момент хранимые на серверах данные превратились не
Данные и законодательствоС развитием GDPR, CCPA, ,EU AI Act и прочих законодательных норм и правил по персональным данным появилась необходимость учитывать риск хранения и обработки этих данных. В какой-то момент хранимые на серверах данные превратились не

Данные и законодательствоС развитием GDPR, CCPA, ,EU AI Act и прочих законодательных норм и правил по персональным данным появилась необходимость учитывать риск хранения и обработки этих данных. В какой-то момент хранимые на серверах данные превратились не в актив компании, а в обязательства. Штрафы за утечку и раскрытие персональных данных или несоблюдение законодательных норм огромные, и компании должны учитывать риск. Порой безопаснее не хранить данные, которые могут понадобиться когда-нибудь в будущем, а сразу их удалять.

2 months, 3 weeks назад @ t.me
Designing Data-Intensive ApplicationsГлава 1. Trade-Offs in Data Systems ArchitectureВведениеПервая глава книги получилась объёмной как по количеству страниц так и по количеству информации. По сравнению с первым изданием появилось упоминание Single-Node Da
Designing Data-Intensive ApplicationsГлава 1. Trade-Offs in Data Systems ArchitectureВведениеПервая глава книги получилась объёмной как по количеству страниц так и по количеству информации. По сравнению с первым изданием появилось упоминание Single-Node Da

Designing Data-Intensive ApplicationsГлава 1. Trade-Offs in Data Systems ArchitectureВведениеПервая глава книги получилась объёмной как по количеству страниц так и по количеству информации. По сравнению с первым изданием появилось упоминание Single-Node Data Warehouse решений на примере DuckDB, SQLite, но без деталей. Детали будут раскрываться уже в более поздних главах.Основная мысль первой главы дать читателю понимание, что нет “серебряной пули”, и в каждом решении существуют как свои плюсы так и минусы (trade offs). Посыл авторов благородный, помочь читателю разобраться в море различных технологических решений. Дать фундамент, который будет помогать принимать правильные решения при проек…

2 months, 3 weeks назад @ t.me
Аналитические базы выступают в роли общего хранилища, куда стекаются данные из различных подсистем. Это могут быть OLTP базы, а также внешние сервисы (данные из которых можно тянуть по API, например). Процесс насыщения данными обозначают аббревиатурой ETL
Аналитические базы выступают в роли общего хранилища, куда стекаются данные из различных подсистем. Это могут быть OLTP базы, а также внешние сервисы (данные из которых можно тянуть по API, например). Процесс насыщения данными обозначают аббревиатурой ETL

Аналитические базы выступают в роли общего хранилища, куда стекаются данные из различных подсистем. Это могут быть OLTP базы, а также внешние сервисы (данные из которых можно тянуть по API, например). Процесс насыщения данными обозначают аббревиатурой ETL - Extract Transform Load. Но существует и другая аббревиатура ELT - Extract Load Transform. В первом случае трансформация данных происходит до загрузки в главное хранилище, а во втором уже на стороне хранилища (хранение в “сыром” виде).Также есть процесс reverse ETL, это обратный процесс, когда данные из аналитической базы попадают в транзакционное хранилище. Например, такое практикуется при построении моделей машинного обучения и деплоя и…

2 months, 3 weeks назад @ t.me
Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то р
Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то р Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то р

Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то репозитория на Гитхабе. И сказать, что она мне понравилась это ничего не сказать. Я был в восторге от неё, она стала для меня учебником которого мне не хватало. Помню, что до середины я прочитал её на стареньком планшете. Глаза мои уставали, и я решил заказать её в бумажном вариант.“Кабанчик” до сих пор у меня, пережил несколько переездов и выглядит непрезентабельно. Но к чему этот пост? Я хочу немного изменить формат этого канала и сделать…

3 months назад @ t.me
🔥 Девушка без навыков разработки запустила AI-бота и вышла на первые продажи за месяцАня из комьюнити @its_capitan заметила: люди учат английский годами, но говорить не могут. И тогда она сделала Telegram-бота, который общается с тобой голосовыми на англий
🔥 Девушка без навыков разработки запустила AI-бота и вышла на первые продажи за месяцАня из комьюнити @its_capitan заметила: люди учат английский годами, но говорить не могут. И тогда она сделала Telegram-бота, который общается с тобой голосовыми на англий

🔥 Девушка без навыков разработки запустила AI-бота и вышла на первые продажи за месяцАня из комьюнити @its_capitan заметила: люди учат английский годами, но говорить не могут. И тогда она сделала Telegram-бота, который общается с тобой голосовыми на английском и исправляет ошибки как живой собеседник. Что в итоге:— ~700 пользователей за первый месяц— первые 16 оплат— первая выручка: ~$200— подписка: $8/мес— сделано на n8n + OpenAI без разработчиковНе было ни команды, ни инвестиций, ни кода.Главное — не технология.Главное — простая понятная ценность.Таких запусков в канале уже десятки. Показываем честно: цифры, провалы, рост и продвижение. Без теорий. Только реальные метрики и запуск в реаль…

3 months, 1 week назад @ t.me
Data Pipelines with Apache Airflow, 2-е изданиеРебята из Astronomer совершенно бесплатно раздают электронную книгу Data Pipelines with Apache Airflow®, Second Edition, by Manning. Это обновлённое издание с учётом новой 3-й ветки Airflow, в книге использует
Data Pipelines with Apache Airflow, 2-е изданиеРебята из Astronomer совершенно бесплатно раздают электронную книгу Data Pipelines with Apache Airflow®, Second Edition, by Manning. Это обновлённое издание с учётом новой 3-й ветки Airflow, в книге использует

Data Pipelines with Apache Airflow, 2-е изданиеРебята из Astronomer совершенно бесплатно раздают электронную книгу Data Pipelines with Apache Airflow®, Second Edition, by Manning. Это обновлённое издание с учётом новой 3-й ветки Airflow, в книге используется версия Apache Airflow 3.1.0. Ну и конечно же ИИ не обделили, в книге появился контент про RAG, AI Orchestration и т.д.Приятного чтения, господа! 🤓

3 months, 3 weeks назад @ t.me
📣 📢 13 ИИ агентов для дата инженераРебята из Astronomer выложили 13 полезных ИИ агентов для дата инженера. В списке есть имба-агент, помогающий мигрировать Airflow 2 на Airflow 3 — migrating-airflow-2-to-3Преимущественно агенты сконцентрированы вокруг напи
📣 📢 13 ИИ агентов для дата инженераРебята из Astronomer выложили 13 полезных ИИ агентов для дата инженера. В списке есть имба-агент, помогающий мигрировать Airflow 2 на Airflow 3 — migrating-airflow-2-to-3Преимущественно агенты сконцентрированы вокруг напи

📣 📢 13 ИИ агентов для дата инженераРебята из Astronomer выложили 13 полезных ИИ агентов для дата инженера. В списке есть имба-агент, помогающий мигрировать Airflow 2 на Airflow 3 — migrating-airflow-2-to-3Преимущественно агенты сконцентрированы вокруг написания и тестирования Airflow DAGs, проектирования таблиц БД, data lineage. Боевой комплект дата инженера.Из БД они умеют в Snowflake, Postgres, BigQuery. Также есть навык для работы с SQLAlchemy ORM.Установка агентов:npx skills add astronomer/agentsДля Claude Code можно установить прямо их маркетплейсаclaude plugin marketplace add astronomer/agentsclaude plugin install data@astronomer В комплекте есть Airflow MCP сервер.Ссылка на репозитор…

3 months, 4 weeks назад @ t.me
Инжиниринг Данных Инжиниринг Данных
последний пост 21 час назад
Сегодня был еще один собес. На входе 5 лет опыта. Задачка такая же - платформа на AWS.Кандидат прыгал с Postgres на Snowflake и Databricks. Про dbt не слышал, Airflow мельком. 5 лет это реальный опыт. То есть можно работать годами и ничего не знать, а мож
Сегодня был еще один собес. На входе 5 лет опыта. Задачка такая же - платформа на AWS.Кандидат прыгал с Postgres на Snowflake и Databricks. Про dbt не слышал, Airflow мельком.  5 лет это реальный опыт. То есть можно работать годами и ничего не знать, а мож Сегодня был еще один собес. На входе 5 лет опыта. Задачка такая же - платформа на AWS.Кандидат прыгал с Postgres на Snowflake и Databricks. Про dbt не слышал, Airflow мельком. 5 лет это реальный опыт. То есть можно работать годами и ничего не знать, а мож

Сегодня был еще один собес. На входе 5 лет опыта. Задачка такая же - платформа на AWS.Кандидат прыгал с Postgres на Snowflake и Databricks. Про dbt не слышал, Airflow мельком. 5 лет это реальный опыт. То есть можно работать годами и ничего не знать, а можно за 6 месяцев качнуться на Surfalytics или самому, построить несколько типовых решений и уже будете знать больше чем 90% кандидатов с 5-10 лет опыта.Причина вся та же, люди ленятся учиться и развиваться. Они думаю, что на работе им достаточно навыков и их потом возьмут на другую работу. В свободное время они гуляют и кайфуют. И это хорошо! Но лучше гулять и кайфовать в рабочее время🎃 Но для этого надо бы сначала качнуться как следуют, что…

21 час назад @ t.me
Сегодня проводил собес по system design DE. У Кандидата было резюме на 10 страниц текста! Сами понимаете серьезный кандидат. Я приложил задачку и результат. Чувак не в теме особо про dbt, Snowflake и тп. Прям как из нашего отечественного дата инжиниринга,
Сегодня проводил собес по system design DE. У Кандидата было резюме на 10 страниц текста! Сами понимаете серьезный кандидат. Я приложил задачку и результат. Чувак не в теме особо про dbt, Snowflake и тп. Прям как из нашего отечественного дата инжиниринга, Сегодня проводил собес по system design DE. У Кандидата было резюме на 10 страниц текста! Сами понимаете серьезный кандидат. Я приложил задачку и результат. Чувак не в теме особо про dbt, Snowflake и тп. Прям как из нашего отечественного дата инжиниринга,

Сегодня проводил собес по system design DE. У Кандидата было резюме на 10 страниц текста! Сами понимаете серьезный кандидат. Я приложил задачку и результат. Чувак не в теме особо про dbt, Snowflake и тп. Прям как из нашего отечественного дата инжиниринга, но нет, он был из Индии и уже много лет работает дата инженером. Как я понял весь его опыт был про Spark Jobs на Hadoop. И в основном на этапе data ingestions. Нужно ли знать dbt и Snowflake всем? Нет не нужно. Но это, как бы, самое популярное на рынке и для общего развития неплохо бы знать в общих чертах, как и duckdb, и тп. Это называется grow mindset. Сейчас вообще можно ничего не знать, но работу делать. А если вы еще и понимаете, что …

1 day, 17 hours назад @ t.me
Послушал подкаст Data Engineering Central - там разговор с Джейкобом Мэтсоном, Developer Advocate из MotherDuck (это облачная версия DuckDB). 1. Индустрия устала от сложностиПосле лет оверинжиниринга (Spark, Kafka, огромные кластеры) - маятник качнулся обр
Послушал подкаст Data Engineering Central - там разговор с Джейкобом Мэтсоном, Developer Advocate из MotherDuck (это облачная версия DuckDB). 1. Индустрия устала от сложностиПосле лет оверинжиниринга (Spark, Kafka, огромные кластеры) - маятник качнулся обр

Послушал подкаст Data Engineering Central - там разговор с Джейкобом Мэтсоном, Developer Advocate из MotherDuck (это облачная версия DuckDB). 1. Индустрия устала от сложностиПосле лет оверинжиниринга (Spark, Kafka, огромные кластеры) - маятник качнулся обратно. Всё больше задач решается на одной машине. DuckDB - яркий пример: просто, быстро, без инфраструктуры.2. AI не убьёт дата-инженеров - наоборотКазалось бы, если AI генерирует SQL - зачем инженеры? Но тезис обратный: AI будет генерировать больше запросов, значит нужно больше людей, которые следят за качеством данных и моделями. Роль дата-инженера вырастет, а не исчезнет.3. Data Modeling снова в модеКогда AI пишет запросы, он опирается н…

1 day, 23 hours назад @ t.me
В cвой личный slack добавил себе Notion бота из Notion Calendar, который собирает все встречи и присылает мне список на завтра и время во сколько вставать (за 15 минут до 1й встречи). Notion Calendar позволяет собрать все календари вместе, а если календарь
В cвой личный slack добавил себе Notion бота из Notion Calendar, который собирает все встречи и присылает мне список на завтра и время во сколько вставать (за 15 минут до 1й встречи). Notion Calendar позволяет собрать все календари вместе, а если календарь В cвой личный slack добавил себе Notion бота из Notion Calendar, который собирает все встречи и присылает мне список на завтра и время во сколько вставать (за 15 минут до 1й встречи). Notion Calendar позволяет собрать все календари вместе, а если календарь

В cвой личный slack добавил себе Notion бота из Notion Calendar, который собирает все встречи и присылает мне список на завтра и время во сколько вставать (за 15 минут до 1й встречи). Notion Calendar позволяет собрать все календари вместе, а если календарь закрыт, я вручную дублирую событие в личный календарь. Видно, что день прям busy, но это у меня такие обычные вторник, среда, четверг.Зато, в понедельник тихо, все еще отходят от выходных, а в пятницу все уже готовятся к выходным. Поэтому я уже воспринимаю вторник-четверг как данность, мне хоть в 3 раза больше митингов, справимся🎮Сейчас столько классных штук, которые экономят время:• можно собрать все slackи в одном месте и агент будет вс…

2 days, 10 hours назад @ t.me
Поиск работы за рубежом часто выглядит как хаос: десятки джоб-бордов, LinkedIn, рефералы, противоречивые советыВ итоге можно месяцами что-то делать и не получать приглашений на интервью, а оффера ждать годами. Не потому что ты слабый кандидат — просто в тв
Поиск работы за рубежом часто выглядит как хаос: десятки джоб-бордов, LinkedIn, рефералы, противоречивые советыВ итоге можно месяцами что-то делать и не получать приглашений на интервью, а оффера ждать годами. Не потому что ты слабый кандидат — просто в тв Поиск работы за рубежом часто выглядит как хаос: десятки джоб-бордов, LinkedIn, рефералы, противоречивые советыВ итоге можно месяцами что-то делать и не получать приглашений на интервью, а оффера ждать годами. Не потому что ты слабый кандидат — просто в тв

Поиск работы за рубежом часто выглядит как хаос: десятки джоб-бордов, LinkedIn, рефералы, противоречивые советыВ итоге можно месяцами что-то делать и не получать приглашений на интервью, а оффера ждать годами. Не потому что ты слабый кандидат — просто в твоем поиске нет системы.AgileFluent вот уже 5 лет помогают IT и Digital специалистам искать работу на международке: 800+ офферов в 32 странах, большая команда топовых экспертов и собственная платформа по откликам и нетворку.Ребята ведут крутой канал про международку, где делятся:✔️ историями тех, кто переехал и зарабатывает в валюте,✔️ разборами резюме и LinkedIn профилей,✔️ гайдами, статьями и чек-листами, которые кратно упрощают поискиЕсл…

3 days, 8 hours назад @ t.me
Если вам интересен соревновательный ML — у Яндекса скоро завершается регистрация на Yandex ML Challenge.Формат довольно приятный: длинный онлайн-тур без жёсткого тайминга на несколько часов. Можно спокойно подумать над решениями и потестить разные подходы.
Если вам интересен соревновательный ML — у Яндекса скоро завершается регистрация на Yandex ML Challenge.Формат довольно приятный: длинный онлайн-тур без жёсткого тайминга на несколько часов. Можно спокойно подумать над решениями и потестить разные подходы. Если вам интересен соревновательный ML — у Яндекса скоро завершается регистрация на Yandex ML Challenge.Формат довольно приятный: длинный онлайн-тур без жёсткого тайминга на несколько часов. Можно спокойно подумать над решениями и потестить разные подходы.

Если вам интересен соревновательный ML — у Яндекса скоро завершается регистрация на Yandex ML Challenge.Формат довольно приятный: длинный онлайн-тур без жёсткого тайминга на несколько часов. Можно спокойно подумать над решениями и потестить разные подходы.Из задач:— LLM / foundation models— CV— RL— оптимизация нейросетейСтарт — 21 мая. На всё дают 11 дней и 40 сабмитов на каждую задачу.Топ-100 участников попадут в очный финал на Young Con в Москве.Победителю — 1 млн рублей, топ-15 получат устройства от Яндекса.В целом выглядит как хороший повод проверить себя на актуальных ML-задачах и посмотреть, что делают другие участники.Регистрация ещё открыта.

3 days, 22 hours назад @ t.me
Собрал материал про AI workloads и видео карты на спутниках https://blog.playeronespace.com/p/brains-in-orbit-a-complete-guideРешил, что IoT спутниковая сеть это очень банально. Узнал про LEO PNT - gps на низкой орбите с точностью до см. Очень круто и доро
Собрал материал про AI workloads и видео карты на спутниках https://blog.playeronespace.com/p/brains-in-orbit-a-complete-guideРешил, что IoT спутниковая сеть это очень банально. Узнал про LEO PNT - gps на низкой орбите с точностью до см. Очень круто и доро

Собрал материал про AI workloads и видео карты на спутниках https://blog.playeronespace.com/p/brains-in-orbit-a-complete-guideРешил, что IoT спутниковая сеть это очень банально. Узнал про LEO PNT - gps на низкой орбите с точностью до см. Очень круто и дорого. А вот Edge AI интересный кейс и можно начать с небольшого, если просто сфокусироваться на сам спутник, который будет делать расчеты на борту.

4 days, 10 hours назад @ t.me
Добавил пост про то, как и где учить Databricks https://blog.surfalytics.com/p/navigating-databricks-learning-a
Добавил пост про то, как и где учить Databricks https://blog.surfalytics.com/p/navigating-databricks-learning-a

Добавил пост про то, как и где учить Databricks https://blog.surfalytics.com/p/navigating-databricks-learning-a

6 days, 21 hours назад @ t.me
Отличный аргумент, что AI не заменит нас! А вы умеете кушать готовить?👀
Отличный аргумент, что AI не заменит нас! А вы умеете кушать готовить?👀 Отличный аргумент, что AI не заменит нас! А вы умеете кушать готовить?👀

Отличный аргумент, что AI не заменит нас! А вы умеете кушать готовить?👀

1 week назад @ t.me
Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном н
Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном н Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном н

Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном найме;🔵 7 июня — знакомство с командами и офер.В мероприятии участвуют команды: R&D, Автономный транспорт, Алиса и Умные устройства, Поиск и Суперапп, Независимый Ecom и другие. Вы сможете пообщаться с нанимающими менеджерами и выбрать проект, который покажется самым интересным.Все подробности и полезные ссылки — на сайте. После регистрации с вами свяжется рекрутер и договорится об удобном времени для интервью.

1 week, 1 day назад @ t.me
Добавил секцию блога к сайту. Начнем с базы, что такое спутник 🛰🛰https://blog.playeronespace.com/p/what-is-a-satellite
Добавил секцию блога к сайту. Начнем с базы, что такое спутник 🛰🛰https://blog.playeronespace.com/p/what-is-a-satellite

Добавил секцию блога к сайту. Начнем с базы, что такое спутник 🛰🛰https://blog.playeronespace.com/p/what-is-a-satellite

1 week, 1 day назад @ t.me
За последнее время мне удалось пообщаться со многими компаниями Enterprise-уровня, и у всех одна и та же проблема — криво внедренный Databricks. Что значит криво? Значит неудобно и неинтуитивно. Почему так? Потому что «а кто ж его знает, как надо». Добавим
За последнее время мне удалось пообщаться со многими компаниями Enterprise-уровня, и у всех одна и та же проблема — криво внедренный Databricks. Что значит криво? Значит неудобно и неинтуитивно. Почему так? Потому что «а кто ж его знает, как надо». Добавим За последнее время мне удалось пообщаться со многими компаниями Enterprise-уровня, и у всех одна и та же проблема — криво внедренный Databricks. Что значит криво? Значит неудобно и неинтуитивно. Почему так? Потому что «а кто ж его знает, как надо». Добавим

За последнее время мне удалось пообщаться со многими компаниями Enterprise-уровня, и у всех одна и та же проблема — криво внедренный Databricks. Что значит криво? Значит неудобно и неинтуитивно. Почему так? Потому что «а кто ж его знает, как надо». Добавим сюда, что Databricks в такие конторы внедряется подрядчиками, которые ездят по ушам VP-уровню и другому персоналу, который уже мастер спорта по митингам и презентациям, но у которого есть сложности с технической составляющей организации, в которой они работают годами. Вот и получается: хотели как лучше, а получилось как всегда.Зато таких картин нет в историях со Snowflake. Что бы там ни говорили про цены, производительность и другие особе…

1 week, 1 day назад @ t.me
Microsoft Fabric сложил все туториалы в одном месте https://community.fabric.microsoft.com/t5/Fabric-Updates-Blog/Fabric-Jumpstart-Discover-what-s-possible-with-Microsoft-Fabric/ba-p/5182277Мне так и не довелось с ним поработать глубоко, а вам?
Microsoft Fabric сложил все туториалы в одном месте https://community.fabric.microsoft.com/t5/Fabric-Updates-Blog/Fabric-Jumpstart-Discover-what-s-possible-with-Microsoft-Fabric/ba-p/5182277Мне так и не довелось с ним поработать глубоко, а вам?

Microsoft Fabric сложил все туториалы в одном месте https://community.fabric.microsoft.com/t5/Fabric-Updates-Blog/Fabric-Jumpstart-Discover-what-s-possible-with-Microsoft-Fabric/ba-p/5182277Мне так и не довелось с ним поработать глубоко, а вам?

1 week, 2 days назад @ t.me
Пример coding задачек для собеседования, но уже можно решать с AI. Пример от Staff Engineer из Meta. То есть, вам нужно общаться с агентом и рассказывать, как вы думаете, как решаете задачу. Раньше можно было выучить типовые задачки и постараться, чтобы о
Пример coding задачек для собеседования, но уже можно решать с AI. Пример от Staff Engineer из Meta. То есть, вам нужно общаться с агентом и рассказывать, как вы думаете, как решаете задачу. Раньше можно было выучить типовые задачки и постараться, чтобы о

Пример coding задачек для собеседования, но уже можно решать с AI. Пример от Staff Engineer из Meta. То есть, вам нужно общаться с агентом и рассказывать, как вы думаете, как решаете задачу. Раньше можно было выучить типовые задачки и постараться, чтобы ответ прошел verification. А теперь, задачки по коду превратились в системный дизайн, где нужно все проговаривать.Хорошая новость для тех, кто не любит секции leetcode! Но это в передовых компаниях уже так делают, думаю большинство такое не грозит.https://youtu.be/A1kX8fJx53c?si=Mu3l-TppeqXxxnCVУ кого-то были уже такие примеры на собеседованиях?

1 week, 3 days назад @ t.me
Уважаемая команда по найму,Благодарю вас за интерес к отклонению моей заявки.Я ознакомился с вашим письмом об отказе и был впечатлён вашим процессом принятия решений и стремлением двигаться вперёд с другими кандидатами.Однако в этом году я получил уже нема
Уважаемая команда по найму,Благодарю вас за интерес к отклонению моей заявки.Я ознакомился с вашим письмом об отказе и был впечатлён вашим процессом принятия решений и стремлением двигаться вперёд с другими кандидатами.Однако в этом году я получил уже нема

Уважаемая команда по найму,Благодарю вас за интерес к отклонению моей заявки.Я ознакомился с вашим письмом об отказе и был впечатлён вашим процессом принятия решений и стремлением двигаться вперёд с другими кандидатами.Однако в этом году я получил уже немало писем с отказами. Поэтому, после тщательного рассмотрения, я принял решение не принимать ваш отказ на данном этапе.Ещё раз выражаю восхищение вашей смелостью отказать мне и желаю всяческих успехов в отклонении других кандидатов.С нетерпением жду возможности присоединиться к команде в ближайшее время.С уважением,🏆

1 week, 5 days назад @ t.me
Left Join Left Join
последний пост 3 часа назад
Хогвартс против Хемингуэя Tableau Public — удивительное место. Там можно найти как довольно стандартные, пусть и хорошо сделанные, дашборды с метриками и графиками, так и целые исследования, упакованные в интерактивные инфографики.Например, одно из них пос
Хогвартс против Хемингуэя Tableau Public — удивительное место. Там можно найти как довольно стандартные, пусть и хорошо сделанные, дашборды с метриками и графиками, так и целые исследования, упакованные в интерактивные инфографики.Например, одно из них пос

Хогвартс против Хемингуэя Tableau Public — удивительное место. Там можно найти как довольно стандартные, пусть и хорошо сделанные, дашборды с метриками и графиками, так и целые исследования, упакованные в интерактивные инфографики.Например, одно из них посвящено изучению популярности книг разных жанров на сайте goodreads.com, где пользователи пишут отзывы на прочитанные книги и выставляют оценки по пятибалльной шкале. Автор взял самые популярные из них, у которых уже собралось больше миллиона оценок, и проанализировал их рейтинги. Выяснилось несколько интересных фактов: 🔵Всего таких книг 210. 46 из них или 22% уже стали мировой классикой — среди них «Старик и море», «Ромео и Джульетта», «Вл…

3 часа назад @ t.me
Почти на каждом нашем проекте, как только мы заходим в Metabase, видим одну и ту же картину: дубли запросов, мертвые дашборды, SQL, в котором уже никто не разбирается. Раньше я лез разгребать это руками и тратил по несколько дней на один аудит.В какой-то м
Почти на каждом нашем проекте, как только мы заходим в Metabase, видим одну и ту же картину: дубли запросов, мертвые дашборды, SQL, в котором уже никто не разбирается. Раньше я лез разгребать это руками и тратил по несколько дней на один аудит.В какой-то м

Почти на каждом нашем проекте, как только мы заходим в Metabase, видим одну и ту же картину: дубли запросов, мертвые дашборды, SQL, в котором уже никто не разбирается. Раньше я лез разгребать это руками и тратил по несколько дней на один аудит.В какой-то момент стало понятно, что эту работу можно автоматизировать. Начал собирать инструмент для себя, чтобы хотя бы первую инвентаризацию проводить без боли. Так появился MetaLens.Если честно, я не люблю называть его «ИИ-инструментом», это создаёт ожидание, что есть одна волшебная кнопка и всё чинится само. На деле это полноценный продукт, в основе которого модели Антропика, Metabase MCP и восемь ИИ-агентов, у каждого своя зона ответственности:🔵…

2 days, 4 hours назад @ t.me
Сколько денег приносит ИИ?Amazon, Google, Microsoft и другие технокомпании вкладывают в ИИ огромные деньги: они выпускают все новые продукты на его основе и активно — иногда слишком — продвигают их среди клиентов и даже собственных сотрудников. Учитывая их
Сколько денег приносит ИИ?Amazon, Google, Microsoft и другие технокомпании вкладывают в ИИ огромные деньги: они выпускают все новые продукты на его основе и активно — иногда слишком — продвигают их среди клиентов и даже собственных сотрудников. Учитывая их

Сколько денег приносит ИИ?Amazon, Google, Microsoft и другие технокомпании вкладывают в ИИ огромные деньги: они выпускают все новые продукты на его основе и активно — иногда слишком — продвигают их среди клиентов и даже собственных сотрудников. Учитывая их рвение, может показаться, что это приносит им большие доходы, но, кажется, это не так. По крайней мере пока. 🔜 Здесь собрали данные о затратах и прибылях передовых ИИ-компаний: кроме уже упомянутых, там есть запрещенная в России Meta, Nvidia, OpenAI, Anthropic, Oracle, xAI, Mistral, Cohere и Deepseek. В плюсе пока только Nvidia, которая с 2023 заработала на ИИ-чипах 253 миллиардов. Никто больше к таким результатам даже не приблизился, и в…

4 days, 4 hours назад @ t.me
Гача, доведенная до абсолютаПо пятничной традиции предлагаем способы скоротать время до конца рабочего дня. На этот раз — вариант для тех, кто хочет понять, почему так популярен Genshin и иже с ним, но сам в это играть не хочет. Такие игры называются гача,
Гача, доведенная до абсолютаПо пятничной традиции предлагаем способы скоротать время до конца рабочего дня. На этот раз — вариант для тех, кто хочет понять, почему так популярен Genshin и иже с ним, но сам в это играть не хочет. Такие игры называются гача,

Гача, доведенная до абсолютаПо пятничной традиции предлагаем способы скоротать время до конца рабочего дня. На этот раз — вариант для тех, кто хочет понять, почему так популярен Genshin и иже с ним, но сам в это играть не хочет. Такие игры называются гача, и смысл в них — в том, что что-нибудь собирать, обычно персонажей. Выбрать или купить конкретного героя нельзя — надо «крутить» и надеяться, что он вам выпадет. Увеличить свои шансы можно, вливая в игру либо деньги, либо время, чтобы получить дополнительные «крутки». 🔜 В чем смысл и зачем кому-то тратить время на это казино? Сложно объяснить, но можно прочувствовать на себе, поиграв в Number Gacha — гачу, где надо собирать цифры от 1 до 1…

1 week назад @ t.me
ИИ-поиск, ИИ-почта, ИИ-документыРассказываем про интересные новости с Google I/O 2026. Если кратко: искусственный интеллект становится неотъемлемой частью всех продуктов и сервисов компании.🔜 ИИ станет ключевым компонентом Поиска. Получится что-то средне
ИИ-поиск, ИИ-почта, ИИ-документыРассказываем про интересные новости с Google I/O 2026. Если кратко: искусственный интеллект становится неотъемлемой частью всех продуктов и сервисов компании.🔜 ИИ станет ключевым компонентом Поиска. Получится что-то средне

ИИ-поиск, ИИ-почта, ИИ-документыРассказываем про интересные новости с Google I/O 2026. Если кратко: искусственный интеллект становится неотъемлемой частью всех продуктов и сервисов компании.🔜 ИИ станет ключевым компонентом Поиска. Получится что-то среднее между привычным поиском и ИИ-чатботом, которому теперь можно будет давать не просто ключевые слова, а подробные запросы, задавать уточняющие вопросы в блоке «Обзор от ИИ», создавать поисковых агентов. То есть не просто написать «куплю гараж», а подробно описать, где вы живете, какая у вас машина и какой гараж вам нужен. Google это все обработает, выдаст подробный ответ вместо со стандартной поисковой выдачей и возможно даже что-нибудь нако…

1 week, 2 days назад @ t.me
SQL против мошенниковИнтересная статья про паттерны, по которым можно выявить случаи мошенничества и подозрительной активности на банковских счетах с помощью простого советского SQL. Большинство признаков, на которые надо обращать внимание, известны или ин
SQL против мошенниковИнтересная статья про паттерны, по которым можно выявить случаи мошенничества и подозрительной активности на банковских счетах с помощью простого советского SQL. Большинство признаков, на которые надо обращать внимание, известны или ин

SQL против мошенниковИнтересная статья про паттерны, по которым можно выявить случаи мошенничества и подозрительной активности на банковских счетах с помощью простого советского SQL. Большинство признаков, на которые надо обращать внимание, известны или интуитивно понятны, но автор еще и сами SQL-запросы показывает, и это уже может пригодиться.🔵Скорость снятия денег. Большое количество операций за короткий срок говорит о том, что мошенник пытается поскорее опустошить карту, пока владелец не заметил.🔵Телепортация — в течение небольшого промежутка времени карта использовалась в двух местах, между которыми физически невозможно переместиться с такой скоростью. 🔵Снятия подозрительных сумм. Небол…

1 week, 4 days назад @ t.me
ИИтальянская забастовка Простите за каламбур в заголовке, но в пятницу же можно, правда? 🔜 Руководство Amazon подталкивает сотрудников к автоматизации работы через создание агентов с помощью инструмента MeshClaw — нетрудно догадаться, что он вдохновлен наш
ИИтальянская забастовка Простите за каламбур в заголовке, но в пятницу же можно, правда? 🔜 Руководство Amazon подталкивает сотрудников к автоматизации работы через создание агентов с помощью инструмента MeshClaw — нетрудно догадаться, что он вдохновлен наш

ИИтальянская забастовка Простите за каламбур в заголовке, но в пятницу же можно, правда? 🔜 Руководство Amazon подталкивает сотрудников к автоматизации работы через создание агентов с помощью инструмента MeshClaw — нетрудно догадаться, что он вдохновлен нашумевшим этой зимой OpenClaw. Хотя в компании заявили, что активность использования ИИ не будет учитываться при оценке качества работы, многие в это не верят. Сотрудники Amazon опасаются негативных последствий, если не продемонстрируют, с каким энтузиазмом они внедрили новую технологию в свои процессы. Это все привело к тому, что люди начали использовать агентов везде, где только можно, даже если не нужно. Таким образом они «накручивают» чи…

2 weeks назад @ t.me
Если что-то не ломалось, это надо починить с помощью ИИКурсор мыши уже много лет существует в почти неизменном виде. Функционал у него тоже стабильный — кликать, выделять, перетаскивать объекты. Вот последнее и хотят изменить в DeepMind. Их улучшенный ИИ-к
Если что-то не ломалось, это надо починить с помощью ИИКурсор мыши уже много лет существует в почти неизменном виде. Функционал у него тоже стабильный — кликать, выделять, перетаскивать объекты. Вот последнее и хотят изменить в DeepMind. Их улучшенный ИИ-к

Если что-то не ломалось, это надо починить с помощью ИИКурсор мыши уже много лет существует в почти неизменном виде. Функционал у него тоже стабильный — кликать, выделять, перетаскивать объекты. Вот последнее и хотят изменить в DeepMind. Их улучшенный ИИ-курсор может стать инструментом, который делает проще взаимодействие человека и искусственного интеллекта.🔵 Первого он избавляет от необходимости переключаться между вкладками и программами или писать длинные промпты. Вместо этого можно просто кликнуть мышкой на объект на экране и дать команду голосом: «Убери это», «Перепиши этот текст по-человечески», «Объедини эти столбцы в таблице».🔵Второму он дает контекст. ИИ получает запрос от пользов…

2 weeks, 2 days назад @ t.me
А вы когда-нибудь задумывались, что такое Copilot? Начинаем неделю с любопытной визуализации — и для разнообразия она даже не с Tableau Public!Как и остальные техногиганты, Microsoft активно включилась в ИИ-гонку. Компания сделала ставку на Copilot — спорн
А вы когда-нибудь задумывались, что такое Copilot? Начинаем неделю с любопытной визуализации — и для разнообразия она даже не с Tableau Public!Как и остальные техногиганты, Microsoft активно включилась в ИИ-гонку. Компания сделала ставку на Copilot — спорн А вы когда-нибудь задумывались, что такое Copilot? Начинаем неделю с любопытной визуализации — и для разнообразия она даже не с Tableau Public!Как и остальные техногиганты, Microsoft активно включилась в ИИ-гонку. Компания сделала ставку на Copilot — спорн

А вы когда-нибудь задумывались, что такое Copilot? Начинаем неделю с любопытной визуализации — и для разнообразия она даже не с Tableau Public!Как и остальные техногиганты, Microsoft активно включилась в ИИ-гонку. Компания сделала ставку на Copilot — спорный продукт, который чаще всего попадает в новости, потому что им в очередной раз кто-то недоволен.🔜 Но главный вопрос не «что не так с Copilot», а что такое Copilot? Первый же запрос в Google ведет на страницу ИИ-чатбота, но если копнуть глубже, все оказывается намного запутаннее. Конечно, у OpenAI и Anthropic тоже много разных продуктов, которые часто упоминают под общими, широко известными названиями ChatGPT или Claude. Так что нет ничег…

2 weeks, 4 days назад @ t.me
Шахматы, из которых убрали все лишнееШахматы — это, конечно, прекрасная игра, но не кажется ли вам, что в них слишком много всего? Все эти фигуры, доска огромная, ну куда это все? Почему бы не отбросить всю эту мишуру и не оставить только самое главное: од
Шахматы, из которых убрали все лишнееШахматы — это, конечно, прекрасная игра, но не кажется ли вам, что в них слишком много всего? Все эти фигуры, доска огромная, ну куда это все? Почему бы не отбросить всю эту мишуру и не оставить только самое главное: од

Шахматы, из которых убрали все лишнееШахматы — это, конечно, прекрасная игра, но не кажется ли вам, что в них слишком много всего? Все эти фигуры, доска огромная, ну куда это все? Почему бы не отбросить всю эту мишуру и не оставить только самое главное: один ряд, три фигуры у каждого игрока, которые могут двигаться вперед или назад, восемь клеток. Получатся прекрасные в своей простоте одномерные шахматы. 🔜 У игрока есть ладья, король и конь. Последнему негде ходить буквой Г, но он может двигаться на две клетки вперед и перепрыгивать через чужие фигуры. Задача — поставить мат королю противника, за которого играет ИИ. Единственный минус одномерных шахмат — возможных стратегий в них чуть-чуть …

3 weeks назад @ t.me
Сделай сам: мини-курс по обучению ИИ с нуляЛучший способ разобраться, как что-то работает — попробовать сделать это самому. С языковыми моделями это тоже работает.🔜 На github выложили мини-курс, где автор предлагает собрать GPT своими руками, чтобы понять,
Сделай сам: мини-курс по обучению ИИ с нуляЛучший способ разобраться, как что-то работает — попробовать сделать это самому. С языковыми моделями это тоже работает.🔜 На github выложили мини-курс, где автор предлагает собрать GPT своими руками, чтобы понять,

Сделай сам: мини-курс по обучению ИИ с нуляЛучший способ разобраться, как что-то работает — попробовать сделать это самому. С языковыми моделями это тоже работает.🔜 На github выложили мини-курс, где автор предлагает собрать GPT своими руками, чтобы понять, как устроены современные LLM внутри. Идея проекта в том, что вместо использования готовых библиотек вроде Hugging Face или LangChain написать почти все основные части модели самостоятельно. Для успешного прохождения понадобится только знание Python — опыт работы с ИИ и машинным обучением не обязателен. Курс состоит из шести уроков, за время которых вы напишете токенизатор, познакомьтесь с трансформерной архитектурой, выстроите цикл обучен…

3 weeks, 1 day назад @ t.me
Периодическаяя таблица ИИ-стартаповИИ с нам уже достаточно долго, чтобы вокруг него выросла целая индустрия с разными направлениями — какие-то все еще бурно растут, а какие-то уже даже стабилизируются.Это хорошо видно на визуализации, опубликованной на Tab
Периодическаяя таблица ИИ-стартаповИИ с нам уже достаточно долго, чтобы вокруг него выросла целая индустрия с разными направлениями — какие-то все еще бурно растут, а какие-то уже даже стабилизируются.Это хорошо видно на визуализации, опубликованной на Tab Периодическаяя таблица ИИ-стартаповИИ с нам уже достаточно долго, чтобы вокруг него выросла целая индустрия с разными направлениями — какие-то все еще бурно растут, а какие-то уже даже стабилизируются.Это хорошо видно на визуализации, опубликованной на Tab

Периодическаяя таблица ИИ-стартаповИИ с нам уже достаточно долго, чтобы вокруг него выросла целая индустрия с разными направлениями — какие-то все еще бурно растут, а какие-то уже даже стабилизируются.Это хорошо видно на визуализации, опубликованной на Tableau Public. Автор свел воедино данные об успехах и развитии ИИ-стартапов из нескольких категорйи за год, с февраля 2025 по февраль 2026. Он выделил 4 большие группы ИИ-компаний: 🔵Базовый уровень — разрабатывают сами модели (OpenAI, Anthropic) и ИИ-инфраструктуру (Databricks).🔵Горизонтальный уровень — создают инструменты для широкого списка задач, которые могут использоваться в разных сферах: от написания кода до генерации картинок и музык…

3 weeks, 3 days назад @ t.me
С Днем труда, дорогие подписчики! В честь праздника принесли вам тематический плагин Endless Toil («бесконечный труд»). Если запустить его с Codex, Claude или Cursor, он будет издавать страдальческие стенания по мере того, как ИИ продирается через ваш код.
С Днем труда, дорогие подписчики! В честь праздника принесли вам тематический плагин Endless Toil («бесконечный труд»). Если запустить его с Codex, Claude или Cursor, он будет издавать страдальческие стенания по мере того, как ИИ продирается через ваш код.

С Днем труда, дорогие подписчики! В честь праздника принесли вам тематический плагин Endless Toil («бесконечный труд»). Если запустить его с Codex, Claude или Cursor, он будет издавать страдальческие стенания по мере того, как ИИ продирается через ваш код. Звук и правда душераздирающий и позволяет в полной мере прочувствовать всю тяжесть ИИ-труда.

4 weeks назад @ t.me
А нужна ли вам база данных? Любой бизнес так или иначе генерирует и собирает самые разные данные, которые надо где-то хранить — в идеале так, чтобы еще и обеспечить к ним удобный доступ.Самое логичное решение этой задачи — развернуть базу данных.А что если
А нужна ли вам база данных? Любой бизнес так или иначе генерирует и собирает самые разные данные, которые надо где-то хранить — в идеале так, чтобы еще и обеспечить к ним удобный доступ.Самое логичное решение этой задачи — развернуть базу данных.А что если

А нужна ли вам база данных? Любой бизнес так или иначе генерирует и собирает самые разные данные, которые надо где-то хранить — в идеале так, чтобы еще и обеспечить к ним удобный доступ.Самое логичное решение этой задачи — развернуть базу данных.А что если попробовать без нее?По сути, данные в базе — это обычные файлы, с которыми вполне можно работать напрямую, без дополнительного слоя БДшной логики сверху. Вопрос только в том, будет ли это удобнее и быстрее? Ответ нашли ребята из DBPro — приложения по управлению базами данных. Они протестировали разные способы найти данные внутри простых JSONL-файлов на трех датасетах — с 1000, 100 000 и 1 000 000 записей:🔵Линейный поиск — каждый запрос чи…

1 month назад @ t.me
Приближается дефицит ИИ? Взрывной рост ИИ столкнулся с серьезным препятствием — таким же взрывным ростом цен на железо и недостатком вычислительных мощностей. Стоимость аренды часа использования ИИ-чипов NVIDIA Blackwell подскочила на 48% по сравнению с те
Приближается дефицит ИИ? Взрывной рост ИИ столкнулся с серьезным препятствием — таким же взрывным ростом цен на железо и недостатком вычислительных мощностей. Стоимость аренды часа использования ИИ-чипов NVIDIA Blackwell подскочила на 48% по сравнению с те

Приближается дефицит ИИ? Взрывной рост ИИ столкнулся с серьезным препятствием — таким же взрывным ростом цен на железо и недостатком вычислительных мощностей. Стоимость аренды часа использования ИИ-чипов NVIDIA Blackwell подскочила на 48% по сравнению с тем, что было еще в начале года. Дата-центры в США, мало того что перегружены, так еще и встречают постоянное — и объяснимое — сопротивление местных жителей, которые выступают против их строительства. Если тенденция сохранится, то рынок неизбежно изменится. 🔵Доступ к самым продвинутым и умным моделям будет ограничен. Mythos, новая нашумевшая модель от Anthropic, которой те поделились с достаточно небольшим количеством компаний, тому пример.🔵…

1 month назад @ t.me
SQLite на практике SQLite на практике
последний пост None
Datalytics Datalytics
последний пост 1 day, 5 hours назад
Если давно хотели прокачаться в modern data stack — собрали три практических тренажёра, которые помогут пройти путь от аналитического хранилища до оркестрации пайплайнов и Lakehouse-архитектуры.📊 Симулятор Data Warehouse на базе dbtНаучитесь работать с dbt
Если давно хотели прокачаться в modern data stack — собрали три практических тренажёра, которые помогут пройти путь от аналитического хранилища до оркестрации пайплайнов и Lakehouse-архитектуры.📊 Симулятор Data Warehouse на базе dbtНаучитесь работать с dbt Если давно хотели прокачаться в modern data stack — собрали три практических тренажёра, которые помогут пройти путь от аналитического хранилища до оркестрации пайплайнов и Lakehouse-архитектуры.📊 Симулятор Data Warehouse на базе dbtНаучитесь работать с dbt

Если давно хотели прокачаться в modern data stack — собрали три практических тренажёра, которые помогут пройти путь от аналитического хранилища до оркестрации пайплайнов и Lakehouse-архитектуры.📊 Симулятор Data Warehouse на базе dbtНаучитесь работать с dbt Core, строить хранилище данных, осваивать DataOps-практики, каталог данных и data lineage.Курс подойдёт аналитикам и инженерам данных, которые хотят не просто писать SQL, а собирать поддерживаемые аналитические проекты.→ Начать в демо-доступе💚 Кстати, ИнженеркаТех перевели всю документацию dbt на русский язык — теперь она доступна бесплатно для всех:https://docs.getdbt.tech/🐙 Тренажёр Dagster + Apache NiFiETL-разработка и оркестрация данн…

1 day, 5 hours назад @ t.me
Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном н
Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном н Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном н

Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном найме;🔵 7 июня — знакомство с командами и офер.В мероприятии участвуют команды: R&D, Автономный транспорт, Алиса и Умные устройства, Поиск и Суперапп, Независимый Ecom и другие. Вы сможете пообщаться с нанимающими менеджерами и выбрать проект, который покажется самым интересным.Все подробности и полезные ссылки — на сайте. После регистрации с вами свяжется рекрутер и договорится об удобном времени для интервью.

1 week, 2 days назад @ t.me
⚡️ Стек собран — а оффера всё нет?Самый бесячий парадокс аналитика в 2026.Знаешь SQL на уровне оконок и CTE. Задачки с собесов Т-банка щёлкаешь за вечер. По технике — молодец.А на финальных этапах что-то идёт не так. И в какой-то момент уже не понимаешь —
⚡️ Стек собран — а оффера всё нет?Самый бесячий парадокс аналитика в 2026.Знаешь SQL на уровне оконок и CTE. Задачки с собесов Т-банка щёлкаешь за вечер. По технике — молодец.А на финальных этапах что-то идёт не так. И в какой-то момент уже не понимаешь — ⚡️ Стек собран — а оффера всё нет?Самый бесячий парадокс аналитика в 2026.Знаешь SQL на уровне оконок и CTE. Задачки с собесов Т-банка щёлкаешь за вечер. По технике — молодец.А на финальных этапах что-то идёт не так. И в какой-то момент уже не понимаешь —

⚡️ Стек собран — а оффера всё нет?Самый бесячий парадокс аналитика в 2026.Знаешь SQL на уровне оконок и CTE. Задачки с собесов Т-банка щёлкаешь за вечер. По технике — молодец.А на финальных этапах что-то идёт не так. И в какой-то момент уже не понимаешь — это со мной что-то не так или рынок просто сломался ⚙️Заходите на бесплатный эфир, на котором не будет информации «как стать аналитиком за 30 дней», но будет подробный разбор карьеры аналитика и то как им стать в 2026 году.Ведет Андрон Алексанян — CEO школы аналитики 📉📉📉📉📉📉, 8 лет в аналитике, работал с крупнейшими компаниями РФ и мира.Что обещают разобрать:🔶Как реально устроен вход в аналитику в 2026🔶Как думают нанимающие менеджеры — и чт…

1 week, 5 days назад @ t.me
⚡ А вы полагаетесь на случайность при делении на тест-контроль?В среднем рандом должен дать идеальный баланс по всем — даже ненаблюдаемым — признакам между тестовой и контрольной группой.Но конкретный АБ-тест — это конкретные тест и контроль. Поэтому случа
⚡ А вы полагаетесь на случайность при делении на тест-контроль?В среднем рандом должен дать идеальный баланс по всем — даже ненаблюдаемым — признакам между тестовой и контрольной группой.Но конкретный АБ-тест — это конкретные тест и контроль. Поэтому случа ⚡ А вы полагаетесь на случайность при делении на тест-контроль?В среднем рандом должен дать идеальный баланс по всем — даже ненаблюдаемым — признакам между тестовой и контрольной группой.Но конкретный АБ-тест — это конкретные тест и контроль. Поэтому случа

⚡ А вы полагаетесь на случайность при делении на тест-контроль?В среднем рандом должен дать идеальный баланс по всем — даже ненаблюдаемым — признакам между тестовой и контрольной группой.Но конкретный АБ-тест — это конкретные тест и контроль. Поэтому случайное распределение на группы наверняка окажется несбалансированным, что приведёт к проблемам с интерпретацией результатов теста. Итог — неверные бизнес-решения.Андрей Романов, тимлид команды аналитики Sales Tech, преподаватель и ментор по AБ-тестам, расскажет:🔸 почему случайное деление на группы — это не лучшая стратегия;🔸 по каким метрикам балансировать группы и каким алгоритмом это можно сделать;🔸 как балансировка влияет на чувствительно…

2 weeks, 2 days назад @ t.me
Как по всему GPT расползись гоблиныВ общем, у чатагпт есть разные настройки личности. Одна из таких личностей — это «Nerdy». По-нашему, ботан. Модель в этом режиме становится излишне занудной, но при этом такой а ля глубокой и игривой. Её ключевая фишка в
Как по всему GPT расползись гоблиныВ общем, у чатагпт есть разные настройки личности. Одна из таких личностей — это «Nerdy». По-нашему, ботан. Модель в этом режиме становится излишне занудной, но при этом такой а ля глубокой и игривой. Её ключевая фишка в Как по всему GPT расползись гоблиныВ общем, у чатагпт есть разные настройки личности. Одна из таких личностей — это «Nerdy». По-нашему, ботан. Модель в этом режиме становится излишне занудной, но при этом такой а ля глубокой и игривой. Её ключевая фишка в

Как по всему GPT расползись гоблиныВ общем, у чатагпт есть разные настройки личности. Одна из таких личностей — это «Nerdy». По-нашему, ботан. Модель в этом режиме становится излишне занудной, но при этом такой а ля глубокой и игривой. Её ключевая фишка в том, чтобы пользователь посмотрел на мир с немного странноватой и несерьезной точки зренияКогда обучают модели, то используют разметку — либо автоматическую, либо ручную. Как оказалось, на этапе разметки датасета для личности «Nerdy» хорошие оценки ставили таким ответам, в которых есть какие-то фантастические твари типа гоблинов, единорогов и троллей. Это не то, чтобы специально произошло, то есть в инструкции не было явно указано: если от…

4 weeks, 1 day назад @ t.me
Отличная возможность ворваться в аналитику уже в 2026 годуРебята, если вы давно смотрите в сторону аналитики или хотите прокачаться как специалист, для вас есть классная новость: сейчас ваше время сделать первый шаг!Данных вокруг всё больше, бизнесу нужны
Отличная возможность ворваться в аналитику уже в 2026 годуРебята, если вы давно смотрите в сторону аналитики или хотите прокачаться как специалист, для вас есть классная новость: сейчас ваше время сделать первый шаг!Данных вокруг всё больше, бизнесу нужны Отличная возможность ворваться в аналитику уже в 2026 годуРебята, если вы давно смотрите в сторону аналитики или хотите прокачаться как специалист, для вас есть классная новость: сейчас ваше время сделать первый шаг!Данных вокруг всё больше, бизнесу нужны

Отличная возможность ворваться в аналитику уже в 2026 годуРебята, если вы давно смотрите в сторону аналитики или хотите прокачаться как специалист, для вас есть классная новость: сейчас ваше время сделать первый шаг!Данных вокруг всё больше, бизнесу нужны люди, которые умеют превращать цифры в решения. И именно этим занимаются аналитики данных - профессия, которая стабильно востребована уже много лет и не собирается сдавать позиции.Курс-симулятор «Аналитик данных» от SimulativeЧто внутри:➖12 модулей: SQL, Python, BI, статистика, продуктовые метрики и не только;➖Практика на реальных кейсах, которые помогут нарастить ваше портфолио;➖Свободный формат, можно легко совмещать с другой учебой или …

1 month назад @ t.me
АНА’26: конференция о продуктовой аналитике, искусственном интеллекте и масштабировании цифровых продуктов22 мая в Москве в седьмой раз пройдет АНА — техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд
АНА’26: конференция о продуктовой аналитике, искусственном интеллекте и масштабировании цифровых продуктов22 мая в Москве в седьмой раз пройдет АНА — техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд АНА’26: конференция о продуктовой аналитике, искусственном интеллекте и масштабировании цифровых продуктов22 мая в Москве в седьмой раз пройдет АНА — техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд

АНА’26: конференция о продуктовой аналитике, искусственном интеллекте и масштабировании цифровых продуктов22 мая в Москве в седьмой раз пройдет АНА — техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд. Участники обсудят подходы к созданию AI-first решений и практики, которые помогают быстрее проверять гипотезы, масштабировать внедрение и оптимизировать процессы без роста издержек.Программа АНА’26 охватывает полный цикл data- и AI-разработки: от MLOps до внедрения LLM в продуктовые сценарии. Отдельные треки посвящены AI-агентам и развитию архитектуры.Среди ключевых тем:R&D и экономика масштабирования продуктовМетоды системного снижения …

1 month назад @ t.me
Работа аналитика - уже не только про цифры!Это про умение принимать решения быстрее других.В 2026 году выигрывают не те, кто знает больше инструментов, а те, кто понимает, что именно нужно рынку прямо сейчас.Если вы:🟠застряли в обучении и не понимаете, что
Работа аналитика - уже не только про цифры!Это про умение принимать решения быстрее других.В 2026 году выигрывают не те, кто знает больше инструментов, а те, кто понимает, что именно нужно рынку прямо сейчас.Если вы:🟠застряли в обучении и не понимаете, что Работа аналитика - уже не только про цифры!Это про умение принимать решения быстрее других.В 2026 году выигрывают не те, кто знает больше инструментов, а те, кто понимает, что именно нужно рынку прямо сейчас.Если вы:🟠застряли в обучении и не понимаете, что

Работа аналитика - уже не только про цифры!Это про умение принимать решения быстрее других.В 2026 году выигрывают не те, кто знает больше инструментов, а те, кто понимает, что именно нужно рынку прямо сейчас.Если вы:🟠застряли в обучении и не понимаете, что учить дальше🟠откликаетесь на вакансии, но не получаете ответ🟠хотите в айти, но думаете, что «уже поздно что-то менять»Приглашаем вас бесплатный вебинар, где Андрон Алексанян (CEO Simulative) разложит по полочкам, как на самом деле устроен вход в аналитику сегодня! Андрон ответит на вопросы: ➖почему классические “роадмапы” больше не работают➖как собрать портфолио, которое действительно смотрят➖какие кандидаты получают офферы, даже уступая …

1 month назад @ t.me
Перейдите на следующий уровень: станьте дата-сайентистом уже в 2026!Хотите развиваться в Data Science, но столкнулись с трудностями самостоятельного изучения? У вас есть возможность обучиться с нуля и освоить новую профессию уже в этом году! Data Science -
Перейдите на следующий уровень: станьте дата-сайентистом уже в 2026!Хотите развиваться в Data Science, но столкнулись с трудностями самостоятельного изучения? У вас есть возможность обучиться с нуля и освоить новую профессию уже в этом году! Data Science - Перейдите на следующий уровень: станьте дата-сайентистом уже в 2026!Хотите развиваться в Data Science, но столкнулись с трудностями самостоятельного изучения? У вас есть возможность обучиться с нуля и освоить новую профессию уже в этом году! Data Science -

Перейдите на следующий уровень: станьте дата-сайентистом уже в 2026!Хотите развиваться в Data Science, но столкнулись с трудностями самостоятельного изучения? У вас есть возможность обучиться с нуля и освоить новую профессию уже в этом году! Data Science - одна из самых востребованных и высокооплачиваемых сфер в IT. И сейчас - лучшее время, чтобы войти в профессию. Главный плюс Data Science в том, что он совмещает в себе навыки сразу нескольких направлений: аналитика, инженерия и данных и даже машинное обучение. Всего за 8 месяцев вы:➖Освоите полный стек инструментов: SQL, Python, Pandas, Docker, Airflow и ETL-пайплайны➖Разберётесь в ML и DL: от регрессии и кластеризации до нейросетей, NLP …

1 month, 1 week назад @ t.me
Эйчары больше не спрашивают, владеете ли вы ИИИспользование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности. Не умеешь? До свидания. Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и мног
Эйчары больше не спрашивают, владеете ли вы ИИИспользование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности. Не умеешь? До свидания. Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и мног Эйчары больше не спрашивают, владеете ли вы ИИИспользование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности. Не умеешь? До свидания. Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и мног

Эйчары больше не спрашивают, владеете ли вы ИИИспользование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности. Не умеешь? До свидания. Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и многие наши корпорации заменяют старые позиции на новые, а многие рутинные задачи уже выполняются ИИ-агентами. С чего начать, и как обучить ИИ-инструментам своих сотрудников? Не нужно бесконечно листать новости и тестить приложения очередных стартапов. Многие ответы уже собраны в одном месте — в книге «Синергия интеллектов. Как внедрить ИИ в бизнес-процессы». Здесь описаны крупнейшие ИИ-инструменты, которые доказали свою эффективно не просто в…

1 month, 2 weeks назад @ t.me
⚡️Чем занимается аналитик и как получить оффер в 2026 году?Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство? Все эти переживания уходят, если вы уверены в правильности своих действий
⚡️Чем занимается аналитик и как получить оффер в 2026 году?Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство? Все эти переживания уходят, если вы уверены в правильности своих действий ⚡️Чем занимается аналитик и как получить оффер в 2026 году?Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство? Все эти переживания уходят, если вы уверены в правильности своих действий

⚡️Чем занимается аналитик и как получить оффер в 2026 году?Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство? Все эти переживания уходят, если вы уверены в правильности своих действий, уверены в своих компетенциях, резюме и портфолио. Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также расскажет как получить оффер быстрее других. Кстати на вебинаре разберут и то как стать аналитиком в 30/40/50 и более лет.На вебинаре будет:🟠Разберем полный роадмап: что учить, в каком порядке, до как…

1 month, 3 weeks назад @ t.me
Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы? 2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инст
Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы? 2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инст Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы? 2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инст

Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы? 2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инструментов.В основе — единый стек:raw-данные в Object Storage (S3);табличный слой на Iceberg;обработка через Trino и Spark;интерактив — витрины в ClickHouse и BI.✅ Зачем приходить— Поймёте, как выглядит целевая архитектура «от данных до BI» и как собрать её без лишней ручной интеграции— Получите практические ответы «как делать правильно»: Iceberg, ingestion, метаданные и доступы— Услышите опыт крупного бизнеса: где «чистый Lakehouse» достато…

2 months назад @ t.me
📝 Курс от OTUS: «Администрирование PostgreSQL. Экспертный уровень» — продвинутое погружение в работу с базой данных PostgreSQL в любых средах.Освойте управление PostgreSQL на экспертном уровне: от настройки локальной инфраструктуры до развёртывания высокод
📝 Курс от OTUS: «Администрирование PostgreSQL. Экспертный уровень» — продвинутое погружение в работу с базой данных PostgreSQL в любых средах.Освойте управление PostgreSQL на экспертном уровне: от настройки локальной инфраструктуры до развёртывания высокод 📝 Курс от OTUS: «Администрирование PostgreSQL. Экспертный уровень» — продвинутое погружение в работу с базой данных PostgreSQL в любых средах.Освойте управление PostgreSQL на экспертном уровне: от настройки локальной инфраструктуры до развёртывания высокод

📝 Курс от OTUS: «Администрирование PostgreSQL. Экспертный уровень» — продвинутое погружение в работу с базой данных PostgreSQL в любых средах.Освойте управление PostgreSQL на экспертном уровне: от настройки локальной инфраструктуры до развёртывания высокодоступных кластеров в облаках и Kubernetes. Научитесь автоматизировать процессы, оптимизировать производительность и экономить ресурсы — без лишних сервисов и избыточных затрат.🔥 Приглашаем на серию из 2 бесплатных вебинаров курса — для DevOps‑инженеров, SRE, архитекторов данных, администраторов БД и разработчиков, которые хотят выйти на новый уровень владения PostgreSQL. 🔧💾 📅 26 марта в 20:00 МСК: «Путешествие запроса в PostgreSQL: от разб…

2 months, 1 week назад @ t.me
Боремся с деградацией: системный подход к оптимизации баз данных ⚙️В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и коман
Боремся с деградацией: системный подход к оптимизации баз данных ⚙️В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и коман Боремся с деградацией: системный подход к оптимизации баз данных ⚙️В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и коман

Боремся с деградацией: системный подход к оптимизации баз данных ⚙️В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и команда начинает работать в режиме постоянного реагирования.📆 17 марта в 11:00 (онлайн) приглашаем на бесплатный вебинар «Боремся с деградацией: системный подход к оптимизации баз данных», где подробно разберем работу и оптимизацию MSSQL.👨‍💻 Спикер: Руслан Абдуллин — архитектор БД и интеграции, разработчик Lasmart. Практик аудитов и оптимизации MSSQL для Hoff Tech, «Аптечная сеть 36,6» и ГК «ЭркаФарм».В программе вебинара:— почему MSSQL дегради…

2 months, 2 weeks назад @ t.me
— Пингвин, ты куда? — Мигрирую с Data Warehouse на Lakehouse без чек-листа от Cloud.ru.— Но почему?Не будьте пингвином-нигилистом: переезжать с DWH на Lakehouse нужно по плану, а еще лучше — по чек-листу. Команда Cloud.ru как раз собрала подробную инструкц
— Пингвин, ты куда? — Мигрирую с Data Warehouse на Lakehouse без чек-листа от Cloud.ru.— Но почему?Не будьте пингвином-нигилистом: переезжать с DWH на Lakehouse нужно по плану, а еще лучше — по чек-листу. Команда Cloud.ru как раз собрала подробную инструкц — Пингвин, ты куда? — Мигрирую с Data Warehouse на Lakehouse без чек-листа от Cloud.ru.— Но почему?Не будьте пингвином-нигилистом: переезжать с DWH на Lakehouse нужно по плану, а еще лучше — по чек-листу. Команда Cloud.ru как раз собрала подробную инструкц

— Пингвин, ты куда? — Мигрирую с Data Warehouse на Lakehouse без чек-листа от Cloud.ru.— Но почему?Не будьте пингвином-нигилистом: переезжать с DWH на Lakehouse нужно по плану, а еще лучше — по чек-листу. Команда Cloud.ru как раз собрала подробную инструкцию, которая поможет:▶️Провести аудит текущего хранилища и ETL-процессов.▶️Перейти на Lakehouse без простоев, расхождений и потери доверия бизнеса.▶️Сделать данные надежной основой для аналитики и отчетности с помощью Data Quality, Metadata и Lineage.▶️Спроектировать стабильную Medallion-архитектуру с прозрачными слоями.В чек-листе 15 шагов. На каждом — типовая проблема при миграции + технические рекомендации от инженеров данных, с примерам…

2 months, 3 weeks назад @ t.me
Труба данных Труба данных
последний пост 1 month, 2 weeks назад
💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на р
💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на р 💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на р

💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на рынке — присоединяйся и работай по лучшим связкам- Свободный график🔗Присоединиться - https://wavium.ru⚙️ Наш бот - https://t.me/waviumbot⚡️ПОДАТЬ ЗАЯВКУ⚡️ПОДАТЬ ЗАЯВКУ⚡️ПОДАТЬ ЗАЯВКУ

1 month, 2 weeks назад @ t.me
Channel created
Channel created

Channel created

1 month, 2 weeks назад @ t.me
Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым инте
Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым инте Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым инте

Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым интересно мое мнение на тему, о существовании которой я узнал чисто случайно 7 лет назад. Макс, ты помнишь как ты мне сказал "Так ты ведь получается занимаешься дата инжинирингом?" 😃Я безумно благодарен вам всем за то, что приходили в комменты и писали свое мнение, за бесконечное количество 💩 оставленных под постами, за репосты и материал, который вы приносили. Я смотрю на этот путь, который мы прошли с вами и я вам очень благодарен!По количес…

2 months, 3 weeks назад @ t.me
https://clickhouse.com/blog/clickhouse-kubernetes-operatorКликхаус выкатил K8S Operator. Это чтобы было изи раскатить клик в кубере.Да-да, давайте не будем базы данных держать в кубернетесе, только bare metal и весь остальной бубнеж.Большинству компаний бу
https://clickhouse.com/blog/clickhouse-kubernetes-operatorКликхаус выкатил K8S Operator. Это чтобы было изи раскатить клик в кубере.Да-да, давайте не будем базы данных держать в кубернетесе, только bare metal и весь остальной бубнеж.Большинству компаний бу

https://clickhouse.com/blog/clickhouse-kubernetes-operatorКликхаус выкатил K8S Operator. Это чтобы было изи раскатить клик в кубере.Да-да, давайте не будем базы данных держать в кубернетесе, только bare metal и весь остальной бубнеж.Большинству компаний будет достаточно и клика в кубере. (хотя, если честно, таким компаниям, наверное, рано в кубер)@ohmydataengineer

3 months, 4 weeks назад @ t.me
Если вы искали качественный туториал про то как использовать Claude Code лучше всего с лучшими настройками на данный момент, то вот, я прнс
Если вы искали качественный туториал про то как использовать Claude Code лучше всего с лучшими настройками на данный момент, то вот, я прнс

Если вы искали качественный туториал про то как использовать Claude Code лучше всего с лучшими настройками на данный момент, то вот, я прнс

5 months назад @ t.me
https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько ту
https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько ту

https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько туп 😁@ohmydataengineer - канал "Труба данных" про всякое в мире работы с данным

5 months назад @ t.me
Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике крив
Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике крив

Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике кривая выглядит иначе: после определённого порога контекст начинает не помогать, а мешать. Сигнал тонет в шуме, модель теряет фокус, а качество решений деградирует. Забрал эту картинку себе в копилку как хорошее напоминание.Из этого логично вытекает важный тезис: формулировка задачи вторична, первична политика контекста. Не «как красиво спросить», а что именно и в каком объёме сейчас действительно нужно модели. Принцип «минимум, достаточный дл…

5 months, 1 week назад @ t.me
https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andr
https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andr

https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andrej Karpathy — “We’re summoning ghosts, not building animals” - https://www.youtube.com/watch?v=lXUZvyajciY- Ilya Sutskever – "We're moving from the age of scaling to the age of research"- https://www.youtube.com/watch?v=aR20FWCCjAs- Andrej Karpathy: Software Is Changing (Again) - https://www.youtube.com/watch?v=LCEmiRjPEtQИ нет, это не х2 скорость, это он так в реальности говорит 😃@ohmydataengineer - канал "Труба данных" про всякое в мире …

5 months, 1 week назад @ t.me
Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer
Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer

Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer

5 months, 3 weeks назад @ t.me
Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL
Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL

Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL 13-18;- уведомления в Telegram, Slack, Discord, если бекап сломался или база недоступна;- хранение бекапов локально, в S3 или Google Drive;- health check базы данных раз в минуту;- Apache 2.0 лицензия (полностью открытый);Запуск через Docker:docker run -d --name postgresus -p 4005:4005 -v ./postgresus-data:/postgresus-data --restart unless-stopped rostislavdugin/postgresus:latest📌 GitHub

5 months, 3 weeks назад @ t.me
MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by
MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by

MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by-case basis • Existing issues and pull requests will not be actively reviewed • Community support continues on a best-effort basis through Slackhttps://github.com/minio/minio@ohmydataengineer

5 months, 3 weeks назад @ t.me
https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни
https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни

https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из них что он жрет гигабайт оперативки)@ohmydataengineer

6 months назад @ t.me
Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.
Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это. Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.

Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.

6 months, 1 week назад @ t.me
https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer
https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer

https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer

6 months, 2 weeks назад @ t.me
https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решени
https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решени

https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решение. Циферки, метрики, замеры внутри, все как вы любите 😃P.S. Конечно же, никто не говорит о том, что Kafka надо заменять на Postgres. The claim isn’t that Postgres is functionally equivalent to any of these specialized systems. The claim is that it handles 80%+ of their use cases with 20% of the development effort.Но поздно, стервятники уже налетели...https://www.morling.dev/blog/you-dont-need-kafka-just-use-postgres-considered-harmful/@ohm…

6 months, 2 weeks назад @ t.me
enthusiastech enthusiastech
последний пост None
data будни data будни
последний пост 1 month, 1 week назад
мне кажется последние два интервью отлично смотрятся вместе и дополняют друг друга >_>и отдельно мысль, которая где-то проговаривалась в этих интервью: токены — новый вид бенефита для сотрудников. большие компании готовы вливать миллионы в токены для
мне кажется последние два интервью отлично смотрятся вместе и дополняют друг друга &gt;_&gt;и отдельно мысль, которая где-то проговаривалась в этих интервью: токены — новый вид бенефита для сотрудников. большие компании готовы вливать миллионы в токены для

мне кажется последние два интервью отлично смотрятся вместе и дополняют друг друга >_>и отдельно мысль, которая где-то проговаривалась в этих интервью: токены — новый вид бенефита для сотрудников. большие компании готовы вливать миллионы в токены для своих разработчиков. а сами поставщики фундаментальных моделей в принципе ограничены только внутренними мощностями для своих сотрудников.в подкастах Кирилла Мокевнина @orgprog упоминали, что в долине у каждого второго безлимит на модели OpenAI / Anthropic по тем или иным каналам

1 month, 1 week назад @ t.me
🥷 DHH об agent-first подходеDHH — известный ии-скептик и сторонник написания кода вручную; в своём сетапе он не использует IDE с их подсказками и навигацией по коду — всё набивает ручками (и радуется)ещё DHH известен своими сильным мнением и радикальными в
🥷 DHH об agent-first подходеDHH — известный ии-скептик и сторонник написания кода вручную; в своём сетапе он не использует IDE с их подсказками и навигацией по коду — всё набивает ручками (и радуется)ещё DHH известен своими сильным мнением и радикальными в

🥷 DHH об agent-first подходеDHH — известный ии-скептик и сторонник написания кода вручную; в своём сетапе он не использует IDE с их подсказками и навигацией по коду — всё набивает ручками (и радуется)ещё DHH известен своими сильным мнением и радикальными взглядами — он говорит что думает, не взирая на мнения большинства или отдельных авторитетовнедавно зашёл к Pragmatic Engineer на интервьюhttps://youtu.be/JiWgKRgdgpIи вот наступил действительно переломный момент: ⁃ июль 2025 — DHH не верит и не использует агентов ⁃ январь 2026 — DHH переходит на agent-first разработку что поменялось? вышли модели, которые выдают достаточно хороший результат, которые при минимальных доработках можно шипать …

1 month, 1 week назад @ t.me
🦄 руководитель Claude Code об AI в разработкепослушал интервью Бориса Чёрного в подкасте Ленни. Борис написал первую версию Claude Code и теперь руководит этим направлением в Anthropic.https://youtu.be/We7BZVKbCVwпо их данным сейчас уже 4% всех коммитов в
🦄 руководитель Claude Code об AI в разработкепослушал интервью Бориса Чёрного в подкасте Ленни. Борис написал первую версию Claude Code и теперь руководит этим направлением в Anthropic.https://youtu.be/We7BZVKbCVwпо их данным сейчас уже 4% всех коммитов в

🦄 руководитель Claude Code об AI в разработкепослушал интервью Бориса Чёрного в подкасте Ленни. Борис написал первую версию Claude Code и теперь руководит этим направлением в Anthropic.https://youtu.be/We7BZVKbCVwпо их данным сейчас уже 4% всех коммитов в Гитхаб создаются через Claude Code (ожидают 20% к концу года)интересно, что первую версию Claude Code Борис сделал прошлой весной и это не был сиюминутный успех; популярность инструмента росла постепенно и взрывной рост случился после выхода модели осенью (Опус 4.5 кажется)и с ноября 2025 Борис не написал ни строчки кода вручную — всё через Клода; так же приводит в пример «лучших программистов Spotify», мол, они тоже больше не пишут код ру…

1 month, 1 week назад @ t.me
📁 про культуру ведения тикетовпродолжаю рассказывать про внутрянку нашей команды, привлекая ваше внимание к активным вакансиям >_>> важный дисклеймер: это не я, это всё наш техлид Кирилл (я тут только документирую и выношу)думаю, все видели тикеты
📁 про культуру ведения тикетовпродолжаю рассказывать про внутрянку нашей команды, привлекая ваше внимание к активным вакансиям &gt;_&gt;&gt; важный дисклеймер: это не я, это всё наш техлид Кирилл (я тут только документирую и выношу)думаю, все видели тикеты

📁 про культуру ведения тикетовпродолжаю рассказывать про внутрянку нашей команды, привлекая ваше внимание к активным вакансиям >_>> важный дисклеймер: это не я, это всё наш техлид Кирилл (я тут только документирую и выношу)думаю, все видели тикеты, прочитав которые, осталось непонятным что́ надо сделать; или задачи, где ты вроде сделал что было написано, но оказалось, что нужно было не то и не так ¯\_(ツ)_/¯ мы в команде стараемся придерживаться культуры ведения задач — попробую описать как я это вижу⌘⌘⌘начнём с того, что создать хороший тикет - это отдельная работа; чтобы понятно описать что надо сделать, надо как минимум представлять проблему и целевое решениеесть базовый паттерн, которого …

3 months, 3 weeks назад @ t.me
🦀 Clawdbot / Moltbot / OpenClaw там похоже намечается очередной качественный скачок аи-строения: австрийский программист написал автономного (?) ии-агента… и понеслосьформат горячих новостей не мой любимый жанр, но это залетело в моё инфополе с трёх разных
🦀 Clawdbot / Moltbot / OpenClaw там похоже намечается очередной качественный скачок аи-строения: австрийский программист написал автономного (?) ии-агента… и понеслосьформат горячих новостей не мой любимый жанр, но это залетело в моё инфополе с трёх разных

🦀 Clawdbot / Moltbot / OpenClaw там похоже намечается очередной качественный скачок аи-строения: австрийский программист написал автономного (?) ии-агента… и понеслосьформат горячих новостей не мой любимый жанр, но это залетело в моё инфополе с трёх разных сторон:+ Самат Галимов накидал ссылок для понимания контекстаhttps://t.me/ctodaily/1995+ Pragmatic Engineer выпустил интервью с авторомhttps://youtu.be/8lF7HmQ_RgY+ ребята из Шмит16 собрались вместе где-то на Бали и скупают все доступные мак-мини, чтобы устроить ферму из таких аи-агентов сам автор бота не случайный мамкин вайбкодер — он начинал ещё с веб-приложений в начале 2000-х и потом перешёл на приложения айос для первого айфона. пот…

3 months, 3 weeks назад @ t.me
data будни pinned «📢 ищем дата-коллег к себе в Яндекс Финтех → дата инженеры https://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637 → дата-партнёры (они же системные аналитики двх) https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815 эт
data будни pinned «📢 ищем дата-коллег к себе в Яндекс Финтех → дата инженеры https://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637 → дата-партнёры (они же системные аналитики двх) https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815 эт

data будни pinned «📢 ищем дата-коллег к себе в Яндекс Финтех → дата инженеры https://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637 → дата-партнёры (они же системные аналитики двх) https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815 это прям в нашу команду…»

3 months, 3 weeks назад @ t.me
✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать и
✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать и

✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их…

3 months, 3 weeks назад @ t.me
📢 ищем дата-коллег к себе в Яндекс Финтех→ дата инженерыhttps://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637→ дата-партнёры (они же системные аналитики двх)https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815это прям в нашу команду, то е
📢 ищем дата-коллег к себе в Яндекс Финтех→ дата инженерыhttps://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637→ дата-партнёры (они же системные аналитики двх)https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815это прям в нашу команду, то е

📢 ищем дата-коллег к себе в Яндекс Финтех→ дата инженерыhttps://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637→ дата-партнёры (они же системные аналитики двх)https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815это прям в нашу команду, то есть будем работать вместе) наша команда свежая — начали строить наш двх осенью 2024; поэтому не успели пока обрасти легаси и техдолгами, зато смогли заработать репутацию и кредит доверия за свой первый полный год работы.хотим и дальше нести свет в массы, поэтому активно ищем новых коллегчто у нас есть интересного:→ есть полная документация — наши объекты не идут в прод без описания каждого атрибута→ на нанейминг полей и объектов — есть кон…

3 months, 4 weeks назад @ t.me
✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их
✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их

✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их вместе.⌘ зачем вообще нужно код-ревью+ это вторая пара глаз с иным контекстом и уровнем погружения: автор и ревьюер смотрят на код в разных когнитивных режимах → ловятся разные ошибки+ передача знаний в рамках команды: «применяем вот такие паттерны, а вот так не делаем» → в среднем качестве кода постепенно улучшается+ барьер против энтропии и деградации кодовой базы: без должного присмотра любой проект постепенно превращается в трудно подд…

4 months назад @ t.me
🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и ви
🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и ви

🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и видеть глобальные тенденции⌘⌘⌘по своему масштабу Мартин сравнивает нынешний скачок с переходом программистов с ассемблера на языки более высокого уровнясам Мартин не имеет ничего против вайбкодинга как такового (тут он понимает «вайбкодинга» именно как безоглядное принятие любого результата ллм-ки без глубокого осознания написанного), однако чётко ограничивает зону его возможностей: небольшие проекты, прототипы на выброс и т.д.главный недост…

5 months, 3 weeks назад @ t.me
🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддержи
🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддержи

🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддерживает ~230 человек→ сторадж — около 15–20 петабайт;→ компьют — порядка 100К ядер→ внутри ~20 тысяч объектов основная аналитическая СУБД — Greenplum: около 10 кластеров от 30 до 72 нод в каждомпроблемы с текущей архитектурой⌘ Greenplum имеет ограничение на количество параллельных запросов, которые он может обработать эффективно; считается, что это около ста запросов.⌘ система требует постоянного мониторинга и ручного управления распределение…

7 months, 3 weeks назад @ t.me
а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024
а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024 а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024

а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024

7 months, 3 weeks назад @ t.me
NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут
NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут

NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут

7 months, 3 weeks назад @ t.me
🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тез
🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тез

🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тезис высказывает Farhan Thawar, Head of Engineering в Shopify (всё время читаю как Spotify, приходится себя одёргивать и перепроверять)Shopify среди меня известен своим мега-крутым фаундером — Tobias Lütke; слушал его в Lenny's Podcast — создаёт впечатление очень здравого и продвинутого человекакроме того, про него неоднократно упоминал Lex Fridman, что даёт ещё сколько-то очков этому джентельмену и культуре в его компании⌘⌘⌘ещё добавляет ве…

8 months, 1 week назад @ t.me
🎧 Podcasts
Data Engineering Podcast Data Engineering Podcast
последний пост None
«Ничего такого» by Dodo Enginnering
последний пост None
Запуск завтра Podcast Запуск завтра Podcast
последний пост 1 day, 3 hours назад
Как создаются современные чипы
Как создаются современные чипы Как создаются современные чипы

Чипы — это маленькие кремниевые пластинки внутри всех наших устройств. Без них не разогреется еда в микроволновке и не заведётся автомобиль — чипы нужны буквально везде. При этом их производство — настолько запутанный процесс, что удивительно, как он вообще работает. Сегодня мы разберёмся, как устроены современные чипы и почему в последние годы они подорожали. Поговорю я с Дианой Гришиной — она работала в ASML, единственной в мире компании, которая производит станки для создания самых крутых чипов.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjcRXCVQSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для проектов разной сложности, в том числе дл…

1 day, 3 hours назад @ share.transistor.fm
Как живет российская гражданская авиация после санкций
Как живет российская гражданская авиация после санкций Как живет российская гражданская авиация после санкций

После февраля 2022 года российская гражданская авиация оказалась практически отрезана санкциями от остального мира. Запреты коснулись не только воздушного пространства, но и лизинга, регистрации и обслуживания самолетов. И это целиком поменяло работу авиакомпаний. Как теперь поддерживаются самолеты в России? Сможет ли авиация перейти на «отечественный флот»? Стало ли опаснее летать? Рассказывает Анастасия Дагаева, журналистка и независимый авиационный эксперт.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjeXxtnNSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для проектов разной сложности, в том числе для масштабных задач: https://slc.tl/m4hc…

1 week, 1 day назад @ share.transistor.fm
Как отношения с машиной влияют на человека
Как отношения с машиной влияют на человека Как отношения с машиной влияют на человека

В прошлом выпуске мы разбирались, как устроены эмоциональные ИИ-компаньоны под капотом. А в этом смотрим на отношения с ИИ с другой стороны. Опасно ли общаться с кем-то, кто не может сказать «нет»? Почему романтические отношения переоценены? И что делать родителям, если их ребёнок часами переписывается с ИИ? Самат Галимов говорит с семейным психологом и секс-терапевтом Мариной Травковой.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjccwtV8Selectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для проектов разной сложности, в том числе для масштабных задач: https://slc.tl/w0lq3 Сайт Марины Травковой: https://travkova.com/⚡️ У этого выпуска есть виде…

2 weeks назад @ share.transistor.fm
Отношения с ИИ. Как устроены эмоциональные чат-боты
Отношения с ИИ. Как устроены эмоциональные чат-боты Отношения с ИИ. Как устроены эмоциональные чат-боты

Представьте, что вы достаёте телефон и видите новое уведомление. Собеседник в мессенджере спрашивает, как у вас дела, делится планами, шутит. Вы переписываетесь каждый день, иногда по несколько часов. А теперь представьте, что этот собеседник — не человек, а ИИ-компаньон, который настроен идеально под ваши потребности. Если вас это удивляет, вот ещё один факт: у сервисов с такими ботами уже миллионы пользователей и их популярность растёт. Как создаются эмоциональные ИИ-компаньоны? Какой персонаж среди них — звезда? И как работает эта индустрия? Самат Галимов говорит с Артёмом Родичевым, основателем платформы Ex-human.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjejvUn6Selectel — независи…

3 weeks назад @ share.transistor.fm
ИИ для каждого. Как (и зачем) децентрализовать искусственный интеллект
ИИ для каждого. Как (и зачем) децентрализовать искусственный интеллект ИИ для каждого. Как (и зачем) децентрализовать искусственный интеллект

Искусственного интеллекта в нашей жизни станет только больше. При этом значительная часть вычислительных мощностей для него сосредоточена в руках нескольких крупных американских корпораций — Google, Microsoft, Amazon. Братья Даниил и Давид Либерманы считают, что такая централизация опасна, и строят альтернативную распределенную сеть по опыту Bitcoin. Этот эпизод — о борьбе с монополией на ИИ, мире с AGI и обществе изобилияРеклама. Рекламодатель АО «Селектел». erid: 2SDnjebM1xvSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для проектов разной сложности, в том числе для масштабных задач: https://slc.tl/wkkak ⚡️ У этого выпуска есть видеоверсия!…

4 weeks, 1 day назад @ share.transistor.fm
Как подключить мозг к компьютеру
Как подключить мозг к компьютеру Как подключить мозг к компьютеру

Управление компьютером силой мысли — не научная фантастика. Лаборатории и стартапы по всему миру давно проводят эксперименты и разрабатывают интерфейсы, которые позволят миллионам людей пользоваться технологиями, минуя физические действия. Один из самых громких проектов в этой области — Neuralink Илона Маска; его пациентам вживляют датчики для считывания сигналов прямо в мозг. В этом выпуске кандидат биологических наук и руководитель группы нейрокогнитивных интерфейсов Сергей Шишкин рассказывает, как декодировать работу мозга, можно ли обойтись без инвазивных хирургических операций и на что способны нейротехнологии сегодня.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjcR4GznSelectel — не…

1 month назад @ share.transistor.fm
Что генетика знает о вас? | Михаил Гельфанд
Что генетика знает о вас? | Михаил Гельфанд Что генетика знает о вас? | Михаил Гельфанд

Можно ли «подкрутить» себе настройки здоровья? Существует ли ген алкоголизма? Как читают и редактируют ДНК? Самат Галимов говорит с Михаилом Гельфандом — одним из главных биоинформатиков России — о том, что умеет современная генетика, и разбирает популярные мифы.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjc2ro9kSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для масштабных задач: https://slc.tl/j2698 Телеграм-канал Михаила Гельфанда: https://t.me/mikhail_s_gelfand Рекомендации Михаила:Александр Панчин «Сумма биотехнологии»Александр Марков «Рождение сложности. Эволюционная биология сегодня» Евгений Кунин «Логика случая. О природе и происхо…

1 month, 1 week назад @ share.transistor.fm
Как нейросети меняют правила общения
Как нейросети меняют правила общения Как нейросети меняют правила общения

Почему нам хочется увидеть в искусственном интеллекте собеседника? Как нейросети контролируют ход диалога? И что из-за них меняется в человеческом общении? Культуролог и исследовательница цифровой среды Оксана Мороз объясняет, как общение с искусственным интеллектом влияет на нас.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjdNBa9xSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для проектов разной сложности: https://slc.tl/fmodg⚡️ У этого выпуска есть видеоверсия! Посмотрите ее на нашем YouTube-канале: https://www.youtube.com/@launchtomorrow Будем очень благодарны вам за подписку на канал, лайк и комментарий — это очень поможет нам делать в…

1 month, 2 weeks назад @ share.transistor.fm
Что происходит с наймом в IT
Что происходит с наймом в IT

Как искать работу в 2026? Короткий ответ: непросто! Вместе с основательницей агентства NEWHR Кирой Кузьменко разбираемся, как меняется найм с ИИ, и проходим весь путь от поиска вакансии до переговоров о зарплате. Реклама. Рекламодатель АО «Селектел». erid: 2SDnjd2g7CDSelectel — независимый провайдер, который поможет построить надежную и гибкую ИТ-инфраструктуру для проектов разной сложности: https://slc.tl/vxev6 Агентство Киры: NEWHR.orgКанал Киры: https://t.me/kirafoundКурс про поиск работы: HelloNewJob.orgСлушайте бонусные выпуски «Запуска завтра» и других подкастов студии «Либо/Либо» по подписке Либо/Либо+ в Telegram: https://cutt.ly/zap0225epap и в Apple Podcasts https://cutt.ly/zap0225…

1 month, 3 weeks назад @ share.transistor.fm
Гугл-поиск испортился? Как искать в интернете
Гугл-поиск испортился? Как искать в интернете Гугл-поиск испортился? Как искать в интернете

Раздражает, что выдача в Google замусорена рекламой и нерелевантными ссылками? Вместе с фактчекером Павлом Банниковым разбираемся, почему испортился поиск, что помогает гуглить эффективно и как правильно искать с нейросетями.Реклама. Рекламодатель АО «Селектел». erid: 2SDnjdEyrEdSelectel — Selectel — независимый провайдер, который поможет построить надежную и гибкую инфраструктуру для проектов разной сложности: https://slc.tl/cxf73 Телеграм-канал Павла: https://t.me/pavelbannikovПроекты журналиста-расследователя Хэнка ван Эсса: https://www.digitaldigging.org⚡️ У этого выпуска есть видеоверсия! Посмотрите ее на YouTube: https://youtu.be/0vp_239OXdw. Будем очень благодарны вам за подписку на …

2 months назад @ share.transistor.fm
Биохакинг. Говорим о привычках в Кремниевой долине
Биохакинг. Говорим о привычках в Кремниевой долине Биохакинг. Говорим о привычках в Кремниевой долине

Да, это выпуск про ванну со льдом, медитации и сауну после работы! Андрей Дороничев — один из создателей мобильного приложения YouTube — рассказывает, что делают технари в Долине, чтобы улучшить здоровье и продуктивность. Реклама. Рекламодатель АО «Селектел». erid: 2SDnjdTcQAmSelectel — провайдер IT-инфраструктуры для ИИ-проектов. Серверы с видеокартами и другие продукты для вашего бизнеса: https://slc.tl/lejz5 Андрей Дороничев: https://www.instagram.com/dobry?igsh=aHByNmFtMXpsb2dz⚡️ У этого выпуска есть видеоверсия! Посмотрите ее на YouTube: https://youtu.be/k9ahY12o3ZA Будем очень благодарны вам за подписку на канал, лайк и комментарий — это очень поможет нам делать видеоверсию и дальше!С…

2 months, 1 week назад @ share.transistor.fm
Почему всем так нужны видеокарты от NVIDIA
Почему всем так нужны видеокарты от NVIDIA

OpenAI, Anthropic, Google, Meta и другие игроки на рынке искусственного интеллекта каждый год делают ставку на увеличение своих моделей и закупают сотни тысяч графических процессоров, которые производит компания NVIDIA. Как NVIDIA стала главным поставщиком железа для целой индустрии и почему никто пока не смог ее догнать? Разбираемся вместе с бывшим ведущим архитектором AI-решений в NVIDIA Денисом Тимониным.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdwsuEP 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Другие эпизоды подкаста про производство процессоров:Выпуск с инженером из Intel https://pc.st/e/2fNCK2Yhh-TВыпуск про литографию с инженеркой из ASML https://pc.st/e/4…

5 months, 2 weeks назад @ share.transistor.fm
Суперфоркастинг. Как делать точные прогнозы на будущее
Суперфоркастинг. Как делать точные прогнозы на будущее

Михаил Ягудин — математик, соосновавший группу самых точных форкастеров в мире. Вместе с коллегами Миша предсказывает выборы, войны, пандемии и другие события, способные повлиять на жизни миллионов людей. Самат расспросил Мишу, как устроена работа суперфоркастеров, помогают ли предсказательные навыки в личных целях и какие прогнозы эксперты делают по искусственному интеллекту. Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjcr9Pfd 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Группа «Самоцветы» https://samotsvety.org/Рассылка Нуньо Семпере https://blog.sentinel-team.org/Потренировать предсказания https://sage-future.org/Репорт AI 2027 от сооснователя Самоцветов https://ai…

5 months, 3 weeks назад @ share.transistor.fm
Цифровая хрупкость. Как сохранить важное в сети
Цифровая хрупкость. Как сохранить важное в сети

Возможно, вы помните фразу: «Всё, что попало в интернет, остаётся там навсегда». Оказывается, это не совсем правда. Мы уже потеряли огромную часть интернета и культурного наследия. Почему что-то может пропасть из сети? Как архивируются данные? И кто решает, что нужно сохранить, а что нет? Самат Галимов говорит с исследовательницей интернета Полиной Колозариди и кинокритиком Сергеем Сычёвым.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdhbXiw 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Чёрная Пятница в Либо/Либо с 24 ноября по 1 декабря!Подписка «Либо/Либо+ Telegram» в телеграме со скидкой https://cutt.ly/zap25bfeptg Подписка «Либо/Либо+ Apple Podcasts» со скидкой http…

6 months назад @ share.transistor.fm
Ваш робоводитель прибыл. Как устроено беспилотное такси
Ваш робоводитель прибыл. Как устроено беспилотное такси

Калифорнийская компания Waymo делает сервис роботакси в разных городах США. Мы позвали инженера оттуда, чтобы разобраться, как научить машину принимать решения и подготовить ее к непредсказуемости на дорогах. В этом эпизоде обсуждаем, как миллиарды миль тестовых заездов, сложные симуляции и каскадеры приближают нас к автономному вождению.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdhbXiw 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Слушайте бонусные эпизоды «Запуск++», а еще другие бонусы студии «Либо/Либо» по подписке ЛибоЛибо+ в Apple Podcasts https://cutt.ly/zap0225epap и в закрытом телеграм-канале Либо/Либо https://cutt.ly/zap0225eptg Подписаться только на «Запус…

6 months, 1 week назад @ share.transistor.fm
Moscow Python Podcast Moscow Python Podcast
последний пост 3 weeks, 4 days назад
Новости мира Python за апрель 2026
Новости мира Python за апрель 2026

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Reverting the incremental GC in Python 3.14 and 3.15 — https://discuss.python.org/t/reverting-the-incremental-gc-in-python-3-14-and-3-15/107014 PEP 772 – Packaging Council governance process — https://peps.python.org/pep-0772/ What's new in pip 26.1 - lockfiles and dependency cooldowns — https://ichard26.github.io/blog/2026/04/whats-new-in-pip-26.1/ PyPI Security Best Practices — https://github.com/lirantal/pypi-security-best-practices Еще один package manager - pixi — https://codecut.ai/uv-pixi-…

3 weeks, 4 days назад @ learnpython.podbean.com
Новости мира Python за март 2026
Новости мира Python за март 2026

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Python 3.15’s JIT is now back on track — https://fidget-spinner.github.io/posts/jit-on-track.html OpenAI покупает Astral — https://openai.com/index/openai-to-acquire-astral/ JazzBand закрывается — https://jazzband.co/news/2026/03/14/sunsetting-jazzband Первый публичный релиз Django Modern Rest — https://github.com/wemake-services/django-modern-rest/releases/tag/0.1.0 Defense in Depth: A Practical Guide to Python Supply Chain Security — https://bernat.tech/posts/securing-python-supply-chain/ The S…

1 month, 2 weeks назад @ learnpython.podbean.com
JS vs Python: сравнение экосистем на реальном проекте
JS vs Python: сравнение экосистем на реальном проекте

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

2 months, 1 week назад @ learnpython.podbean.com
Новости мира Python за февраль 2026
Новости мира Python за февраль 2026

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Мейнтейнер httpx закрыл доступ к issues и discussions — https://github.com/encode/httpx/discussions/3784 Anthropic invests $1.5 million in the Python Software Foundation and open source security — https://pyfound.blogspot.com/2025/12/anthropic-invests-in-python.html Evolving Git for the next decade — https://lwn.net/Articles/1057561/ A CLI to fight GitHub spam — https://hugovk.dev/blog/2026/gh-triage/ Starlette 1.0.0rc1 — https://starlette.dev/release-notes/ Ссылки выпуска:

Курс Learn Python — ht…

2 months, 2 weeks назад @ learnpython.podbean.com
Агентские системы от разработки до оценки
Агентские системы от разработки до оценки

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Ссылки от Сергея: toloka.ai - компания

https://platform.toloka.ai/ - self service (быстрая разметка данных)

tendem.ai - Tendem (кентавр AI + human)

как начать работать в Толоке экспертом: https://mindrift.ai/apply Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https…

3 months, 2 weeks назад @ learnpython.podbean.com
Новости мира Python за январь 2026
Новости мира Python за январь 2026

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Новости выпуска: убивают ли Python инкрементальные улучшения

релиз Pandas 3.0 недавние тренды Django Security Team в CPython и psutils избавились от busy-polling при работе с subprocess PyPI в 2025 году

PEP 822 — d-string или новый синтаксис для многострочных строковых литералов без лишних отступов Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.r…

3 months, 3 weeks назад @ learnpython.podbean.com
Как команды используют LLM: агенты, ревью и единый инструмент
Как команды используют LLM: агенты, ревью и единый инструмент

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

4 months назад @ learnpython.podbean.com
Новости мира Python за декабрь 2025
Новости мира Python за декабрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: тайп-чекер ty от Astral — https://astral.sh/blog/ty

ежегодный топ Python-библиотек — https://tryolabs.com/blog/top-python-...

Microsoft зарелизила mssql-python 1.0.0 — https://techcommunity.microsoft.com/b...

Deprecations via warnings don’t work for Python libraries — https://sethmlarson.dev/deprecations-...

30 things I’ve learned from 30 years as a Python freelancer — https://lerner.co.il/2025/12/08/30-th...

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegr…

4 months, 3 weeks назад @ learnpython.podbean.com
Новости мира Python за 2025 год
Новости мира Python за 2025 год

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Блог Коли Хитрова — https://t.me/nkhitrov_blog

Канал Никиты Соболева — https://t.me/opensource_findings Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python»…

5 months назад @ learnpython.podbean.com
Новости мира Python за ноябрь 2025
Новости мира Python за ноябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

5 months, 3 weeks назад @ learnpython.podbean.com
Новый фреймворк задач, безопасность и почему всё ещё нет Async
Новый фреймворк задач, безопасность и почему всё ещё нет Async

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

Ведущие – Григорий Петров и Михаил Корнеев Эфир с Дмитрием про карьеру — https://t.me/geekfactor_devs/16

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

5 months, 3 weeks назад @ learnpython.podbean.com
Релиз 3.14 и другие новости мира Python за октябрь 2025
Релиз 3.14 и другие новости мира Python за октябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

6 months, 2 weeks назад @ learnpython.podbean.com
Почему Python выбирают для масштабирования
Почему Python выбирают для масштабирования

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

6 months, 3 weeks назад @ learnpython.podbean.com
Новости мира Python за сентябрь 2025
Новости мира Python за сентябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: Full Python support in Wasmer Edge (Beta)

Unlocking Performance in Python's Free-Threaded Future: GC Optimizations Scaling asyncio on Free-Threaded Python Pydantic Ai 1.0 released

PEP 806 – Mixed sync/async context managers with precise async marking Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https:/…

7 months, 3 weeks назад @ learnpython.podbean.com
Отвечаем на вопросы с Никитой Соболевым
Отвечаем на вопросы с Никитой Соболевым

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

В этом выпуске отвечаем на вопросы зрителей вместе с Никитой Соболевым и задаем свои Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

Курс «Основы Python» от Learn Python — …

8 months, 1 week назад @ learnpython.podbean.com
Podlodka Podcast Podlodka Podcast
последний пост 3 days, 23 hours назад
Podlodka #478 – Zed
Podlodka #478 – Zed Podlodka #478 – Zed

Кирилл Булатов помогает разрабатывать Zed – редактор кода, написанный на Rust командой, которая раньше делала Atom. Без Electron, без готовых UI-фреймворков: у Zed собственный графический движок GPUI, Tree-sitter как основа для парсинга и CRDT для совместного редактирования без конфликтов. В выпуске Кирилл объясняет, почему команда выбрала именно этот путь и что из этого получилось. Разберём архитектуру редактора изнутри: что происходит от открытия файла до работы с AI-агентом, как устроен протокол ACP, зачем Zed написал собственный UI-движок вместо использования готового и почему команда не стала брать экосистему плагинов VSCode. Поговорим о пользователях, конкурентах и о том, как опенсорс…

3 days, 23 hours назад @ soundcloud.com
Podlodka #477 – Ruby on Rails Deep Dive
Podlodka #477 – Ruby on Rails Deep Dive Podlodka #477 – Ruby on Rails Deep Dive

Кирилл Мокевнин – сооснователь онлайн-школы программирования «Хекслет», разработчик с почти двадцатилетним стажем, амбассадор организованного программирования и автор одноимённых YouTube- и Telegram-каналов. Он работал с Ruby on Rails ещё в коммерческой разработке, вокруг Rails строился сам Хекслет, и во многом на рельсах формировался его инженерный опыт. Rails много раз хоронили, но он почему-то продолжает жить. В него коммитят, вокруг него остаются большие продукты, он по-прежнему очень быстро закрывает типовые веб-задачи и даёт то самое ощущение, что один человек может сделать приложение от и до. Разбираем главные идеи рельсов: convention over configuration, ActiveRecord, миграции, серве…

1 week, 3 days назад @ soundcloud.com
Podlodka #476 – Релокация в Австралию
Podlodka #476 – Релокация в Австралию Podlodka #476 – Релокация в Австралию

Австралия – идеальный кандидат для релокации. Английский язык, океан, безопасность, высокий уровень жизни, нормальный work-life balance. В этом выпуске Константин Аксенов, разработчик и многодетный отец, разбирает все аспекты переезда и жизни в Австралии. Говорим про все типы виз, поиск работы в IT, аренду, медицину, культурную адаптацию и, конечно же, про главный вопрос: кому Австралия действительно подходит, а кому лучше не строить вокруг нее большие планы. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в выпуске:

Егор Толсто…

2 weeks, 4 days назад @ soundcloud.com
Podlodka #475 – Django
Podlodka #475 – Django Podlodka #475 – Django

В ряду выпусков про фреймворки пополнение! Разбираемся, правда ли в Django есть все, что нужно для типичного веб-сервиса, и правда ли это лучший выбор для перфекционистов с дедлайнами! А помогает нам Артем Малышев. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в выпуске:

Женя Кателла, Стас Цыганов Полезные ссылки: Сайт Django

https://www.djangoproject.com/

3 weeks, 3 days назад @ soundcloud.com
Podlodka #473 – Технологии продления жизни
Podlodka #473 – Технологии продления жизни Podlodka #473 – Технологии продления жизни

В этом выпуске вместе с Витой Степановой разбираемся, что такое старение с точки зрения биологии, где сегодня находится наука и какими технологиями уже можно воспользоваться. Обсудили, какие направления в индустрии сейчас выглядят наиболее перспективными и чем занимаются компании вроде Gero и Insilico. Отдельно, конечно, поговорили о роли AI, данных и носимых устройств — и о том, где за этим стоят реальные возможности. И напоследок — о женском здоровье как одном из ключевых направлений в теме долголетия! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com…

1 month назад @ soundcloud.com
Podlodka #472 – Каузальные модели
Podlodka #472 – Каузальные модели Podlodka #472 – Каузальные модели

Никита Поваров, principal analyst в JetBrains, пришёл, чтобы рассказать об одной из самых коварных ловушек в работе с данными: мы привыкли видеть корреляции, но совершенно не умеем доказывать причинность. А разница между "связано" и "вызывает" – это разница между правильным решением и красивой иллюзией. В выпуске прошли по истории вопроса от Гальтона и Фишера до современных каузальных графов: почему исторически статистика и каузальность шли разными путями и как они всё-таки сошлись. Разбираем d-сепарацию, конфаундеры, медиаторы и строим каузальные графы на конкретных примерах из A/B тестирования, медицины и продуктовой аналитики. Выпуск для всех, кто работает с данными и хочет не просто нах…

1 month, 1 week назад @ soundcloud.com
Podlodka Deep Dive #1 — C++
Podlodka Deep Dive #1 — C++ Podlodka Deep Dive #1 — C++

Антон Полухин – член комитета по стандартизации C++, что делает его одним из тех людей, кто решает, каким будет C++ в будущем. При этом Антон пишет на C++ высоконагруженный код каждый день в техплатформе городских сервисов Яндекса. Еще он – создатель и активный ментейнер многих библиотек Boost, и автор книги «Boost C++ Application Development Cookbook». C++ пинают все кому не лень – от госдепа США до российских студентов, которые со страхом вспоминают лабы на нем. При этом язык по-прежнему живет везде: системное программирование, игровые движки, финтех, embedded, браузеры. Почему так? Почему у него такая репутация, откуда взялось столько плохого кода, и чем вообще виноваты шаблоны C++? Вмес…

1 month, 2 weeks назад @ soundcloud.com
Podlodka #471 – Генерация случайных чисел
Podlodka #471 – Генерация случайных чисел Podlodka #471 – Генерация случайных чисел

Случайные числа нужны почти в каждой программе. Для программиста все выглядит очень просто – достаточно вызова функции стандартной библиотеки. А под капотом там происходит очень много интересного! Чтобы разобраться в том, как генерируются хорошие случайные числа, мы позвали Евгения Додиса, профессора университета Нью-Йорка, который во многом определил, как выглядят и работают современные генераторы случайных чисел, и участвовал в их дизайне для Linux, Apple и Windows. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https…

1 month, 3 weeks назад @ soundcloud.com
Podlodka #470 – Vim
Podlodka #470 – Vim Podlodka #470 – Vim

Многие думают, что Vim давно уже не актуален и остался мемом и игрушкой для гиков. В выпуске мы обсудили, зачем можно его использовать в современном мире, когда вокруг куча IDE и текстовых редакторов, что из себя представляет осовремененная версия под именем NeoVim и почему она до сих пор актуальна и остается для многих разработчиков способом собрать персональную среду разработки под свой реальный рабочий процесс. Поговорили, в чем принципиальные архитектурные отличия NeoVim от других, почему его сила не только в плагинах, а в самой модели взаимодействия с текстом, как сегодня устроен современный стек с Lua, LSP и Tree-sitter, и с чего начать, если давно хотелось попробовать NeoVim не как э…

1 month, 3 weeks назад @ soundcloud.com
Podlodka #469 – Flutter
Podlodka #469 – Flutter Podlodka #469 – Flutter

Flutter давно стал мейнстримной кросс-платформой и заметным игроком в мобильной разработке: его ценят за быструю разработку и хороший тулинг, в частности hot reload.

Марк Абраменко, бывший Head of Flutter в Surf и мобильный инженер Rhino, разобрал ключевые темы: Impeller и миф о лагах на iOS, ограничения Dart для сложной логики и реальность «одной кодовой базы» для desktop, web и mobile. Конечно же, не могли обойти тему написания кода на Flutter с помощью AI-агентов. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https:…

2 months назад @ soundcloud.com
Podlodka #468 – Маленькие языковые модели
Podlodka #468 – Маленькие языковые модели Podlodka #468 – Маленькие языковые модели

Что делать, чтобы рынок ИИ не захватили монополисты, и мы все не стали радикально зависимы от OpenAI, Anthropic и других корпораций? Научиться работать с локальным ИИ! Чтобы разобраться в теме мы позвали Ивана Ямщикова из Pleias, и поговорили про то, как устроены маленькие языковые модели. Занятный факт: пока мы писали выпуск, вышла новость о том, что Nvidia в партнерстве с Pleias выпустила открытый датасет в рамках проекта Nvidia Nemotron. Почему открытые датасеты важны для маленьких моделей – тоже обсудили в выпуске! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: w…

2 months, 1 week назад @ soundcloud.com
Podlodka #467 – Системный подход к релокации
Podlodka #467 – Системный подход к релокации Podlodka #467 – Системный подход к релокации

Переезд в другую страну часто выглядит как выбор между «по зову сердца» и «по таблице в Notion», но на практике успешная релокация почти всегда требует и того, и другого. Это не только выбор визы и билетов, но и большой жизненный проект, требующий принятия десятков решений. В этом выпуске вместе с Василием Юренковым – создателем проекта Greener Relocation, мы обсудили, как понять свои реальные критерии выбора нового места и о чём важно подумать заранее. А ещё поговорили о том, как составить реалистичный роадмап релокации, рассчитать бюджет и не сломаться в процессе, когда заканчиваются силы, расходятся ожидания и растёт стресс. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и…

2 months, 2 weeks назад @ soundcloud.com
Podlodka #466 – Оконные менеджеры
Podlodka #466 – Оконные менеджеры Podlodka #466 – Оконные менеджеры

Мы редко задумываемся о том, как вообще управляем окнами. Alt-Tab, мышка, перетаскивание, сворачивание – как-то работает и ладно. Но если присмотреться, это один из самых недоосмысленных инструментов в нашей ежедневной работе. Мы проводим за экраном по 8 часов в день, переключаемся между задачами, проектами, контекстами – и при этом живём в модели, которую даже не выбирали. В этом выпуске мы решили поговорить об оконных менеджерах и том, что стоит за терминами stacking, tiling, workspaces. Обсудили ментальную модель управления экраном, контроль, снижение хаоса и то, как меняется ощущение от работы, когда вы перестаёте случайно двигать окна мышкой. Разобрались, чем тайлинг отличается от стек…

2 months, 3 weeks назад @ soundcloud.com
Podlodka #465 – OCaml
Podlodka #465 – OCaml Podlodka #465 – OCaml

OCaml – уникальный язык и по своему историческому значению, и по фичам. Он сильно повлиял практически на все современные языки, на нем до сих пор написаны многие из их компиляторов, и одновременно с этим он считается идеальным входом для новичков в мир функционального программирования. А погружаемся в этот язык мы вместе с Павлом Аргентовым, программистом из Evrone, который страстно любит OCaml и пишет на нем очень много кода. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в в…

3 months назад @ soundcloud.com
Podlodka #464 – Хэш таблицы
Podlodka #464 – Хэш таблицы Podlodka #464 – Хэш таблицы

Хэш-таблицы – одна из самых элегантных структур данных: простая на поверхности и бесконечно глубокая внутри. Андрей Аксенов, автор поискового движка Sphinx, разбирает их устройство от фундамента до тонкостей реализации. В выпуске обсуждаем два подхода к разрешению коллизий: Open addressing и Buckets, выбор хэш-функций для разных задач, развенчиваем популярные мифы вроде "load factor больше 0.5 – это смерть". Разбираемся, нужны ли криптографические хэш-функции, когда имеет смысл писать свою хэш-таблицу и почему скорость хэш-функции не всегда благо. Выпуск для тех, кто хочет понимать, что происходит под капотом стандартных коллекций, и для тех, кто задумывается о собственных реализациях. Такж…

3 months, 1 week назад @ soundcloud.com
Проветримся! Проветримся!
последний пост 2 weeks, 4 days назад
Claude Mythos: кибербезопасность всё?
Claude Mythos: кибербезопасность всё?

Давайте разберёмся, что такое Claude Mythos и на что стоит обратить внимание в контексте самого шумного релиза моделей в апреле. телеграм подкаста: https://t.me/progulka Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

2 weeks, 4 days назад @ buzzsprout.com
Екатерина Кухтенко: диагностика вирусных заболеваний
Екатерина Кухтенко: диагностика вирусных заболеваний

Екатерина Кухтенко — фаундер стартапа VAir. VAir позволяет точно детектировать ряд вирусов в дыхании пациента. 11 Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

3 weeks, 2 days назад @ buzzsprout.com
Говард Tёрман: Иисус и те, кому нечего терять
Говард Tёрман: Иисус и те, кому нечего терять

Сегодня делаем обзор книги Говарда Тёрмана Книга: https://en.wikipedia.org/wiki/Jesus_and_the_Disinherited "Бродский" о доставке: https://www.instagram.com/reel/DXPziC8DH_0/ Свежий сабстак: https://caput.substack.com/p/it-is-not-your-ai Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

1 month, 1 week назад @ buzzsprout.com
Андрей Себрант: экзоскелеты и роботы
Андрей Себрант: экзоскелеты и роботы

Андрей Себрант — директор Яндекса по стратегическому маркетингу, автор и ведущий подкаста "Трёп Себранта", автор телеграм канала TechSparks. Подкаст: https://sebrant.chat/ Канал: https://t.me/techsparks Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

3 months назад @ buzzsprout.com
Александ Ерин: Автоматизация продаж
Александ Ерин: Автоматизация продаж

Александр Ерин создатель Linked Helper. Теорема, о которой Александр говорит в выпуске: https://drive.google.com/file/d/1ZwgEAEh319Jz3ea5uCfgRbU0z_dkskNh/view?pli=1 Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

5 months, 1 week назад @ buzzsprout.com
Василий Королишин: спина айтишника
Василий Королишин: спина айтишника

Василий Королишин стажировался в Южной Корее и США, а сейчас входит в ряд международных ассоциаций врачей (NASS, EANS и RASS). Он является автором 20+ научных публикаций. За 15 лет практики он помог более 10 000 пациентам. Мы поговорили про то, как поддерживать здоровье спины, если вы работаете сидя. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

5 months, 3 weeks назад @ buzzsprout.com
Дмитрий Волков: риски искусственного интеллетка
Дмитрий Волков: риски искусственного интеллетка

Дмитрий Волков старший исследователь в Palisade Research. Он занимается изучением рисков, связанных с искусственным интеллектом. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

6 months, 1 week назад @ buzzsprout.com
Максим Мусин: агенты пишут код
Максим Мусин: агенты пишут код

Максим Мусин основатель и СЕО частной лаборатории Rebels AI. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

6 months, 2 weeks назад @ buzzsprout.com
Артём Москалёв: как искусственный интеллект помогает разрабатывать лекарства
Артём Москалёв: как искусственный интеллект помогает разрабатывать лекарства

Артем Москалев исследователь, занимающийся применением искусственного интеллекта для фармакологических разработок. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

6 months, 3 weeks назад @ buzzsprout.com
Игорь Лабутин: мьюзикл про искусственный интеллект
Игорь Лабутин: мьюзикл про искусственный интеллект

Игорь Лабутин — специалист по машинному обучению, учёный, музыкант и продюсер. На фестивале Edinburgh Fringe с 11 по 16 августа 2025 пройдёт премьера его иммерсивного мюзикла AI: Save Our Souls. Сайт мьюзикла: aisaveoursouls.com Даты: 11–16 августа Место: Lime Studio at Greenside @ George Street Время: 19:45 (45 минут, без перерыва) Билеты: £12 / £9 https://www.edfringe.com/tickets/whats-on/ai-save-our-souls Instagram проекта: https://www.instagram.com/aisaveoursouls/ Indiegogo проекта h...

9 months, 3 weeks назад @ buzzsprout.com
Comand Line Heroes by RedHat Comand Line Heroes by RedHat
последний пост None
Python Bytes Python Bytes
последний пост 4 days, 7 hours назад
#481 Ways to die
#481 Ways to die #481 Ways to die

Topics include Dumb Ways for an Open Source Project to Die, How to create a pylock.toml lockfile, , and Choosing a Python Logging Library in 2026.

4 days, 7 hours назад @ pythonbytes.fm
#480 Proud Parents
#480 Proud Parents #480 Proud Parents

Topics include Using Django Tasks in production, , PyPI packages are increasing rapidly, and httpx2.

1 week, 4 days назад @ pythonbytes.fm
#479 Talking About Types
#479 Talking About Types #479 Talking About Types

Topics include httpxyz one month in, Learn concurrency - a deep dive into multithreading with Python, pip 26.1 - lockfiles and dependency cooldowns, and Python 3.15 `sentinal` values from PEP 661.

2 weeks, 4 days назад @ pythonbytes.fm
#478 Iodine tablets and potable water
#478 Iodine tablets and potable water #478 Iodine tablets and potable water

Topics include profiling-explorer, Reverting the incremental GC in Python 3.14 and 3.15, , and django freeze.

3 weeks, 4 days назад @ pythonbytes.fm
#477 Lazy, Frozen, and 31% Lighter
#477 Lazy, Frozen, and 31% Lighter #477 Lazy, Frozen, and 31% Lighter

Topics include Django Modern Rest, , Cutting Python Web App Memory Over 31%, and tryke - A Rust-based Ptyhon test runner with a Jest-style API.

1 month, 1 week назад @ pythonbytes.fm
#476 Common themes
#476 Common themes #476 Common themes

Topics include Migrating from mypy to ty: Lessons from FastAPI, Oxyde ORM, Typeshedded CPython docs, and Raw+DC Database Pattern: A Retrospective.

1 month, 3 weeks назад @ pythonbytes.fm
#475 Haunted warehouses
#475 Haunted warehouses #475 Haunted warehouses

Topics include Lock the Ghost, Fence for Sandboxing, MALUS: Liberate Open Source, and Harden your GitHub Actions Workflows with zizmor, dependency pinning, and dependency cooldowns.

2 months назад @ pythonbytes.fm
#474 Astral to join OpenAI
#474 Astral to join OpenAI #474 Astral to join OpenAI

Topics include Starlette 1.0.0, Astral to join OpenAI, , and Fire and forget (or never) with Python’s asyncio.

2 months, 1 week назад @ pythonbytes.fm
#473 A clean room rewrite?
#473 A clean room rewrite? #473 A clean room rewrite?

Topics include , refined-github, , and Agentic Engineering Patterns.

2 months, 2 weeks назад @ pythonbytes.fm
#473 A clean room rewrite?
#473 A clean room rewrite? #473 A clean room rewrite?

Topics include , refined-github, , and Agentic Engineering Patterns.

2 months, 2 weeks назад @ pythonbytes.fm
#472 Monorepos
#472 Monorepos #472 Monorepos

Topics include Setting up a Python monorepo with uv workspaces, cattrs, Learning to program in the AI age, and VS Code extension.

2 months, 3 weeks назад @ pythonbytes.fm
#471 The ORM pattern of 2026?
#471 The ORM pattern of 2026? #471 The ORM pattern of 2026?

Topics include Raw+DC: The ORM pattern of 2026, pytest-check releases, Dataclass Wizard, and SQLiteo.

2 months, 4 weeks назад @ pythonbytes.fm
#470 A Jolting Episode
#470 A Jolting Episode #470 A Jolting Episode

Topics include Better Python tests with inline-snapshot, jolt Battery intelligence for your laptop, Markdown code formatting with ruff, and act - run your GitHub actions locally.

3 months назад @ pythonbytes.fm
#469 Commands, out of the terminal
#469 Commands, out of the terminal #469 Commands, out of the terminal

Topics include Command Book App, uvx.sh: Install Python tools without uv or Python, Ending 15 years of subprocess polling, and.

3 months, 2 weeks назад @ pythonbytes.fm
#468 A bolt of Django
#468 A bolt of Django #468 A bolt of Django

Topics include django-bolt: Faster than FastAPI, but with Django ORM, Django Admin, and Django packages, pyleak, , and Datastar.

3 months, 3 weeks назад @ pythonbytes.fm
Software Engineering Daily Software Engineering Daily
последний пост 1 day, 6 hours назад
Autonomous Drone Delivery at Scale
Autonomous Drone Delivery at Scale

Autonomous drone delivery has long been the stuff of science fiction, but ongoing advances have moved the space from experimental to operational. Zipline is one of the leading companies in this space, with drones that charge between missions and fly autonomously to deliver packages directly to customers. Kyle Madonia is the VP of Application Software

The post Autonomous Drone Delivery at Scale appeared first on Software Engineering Daily.

1 day, 6 hours назад @ softwareengineeringdaily.com
The European Startup Scene
The European Startup Scene

Europe’s startup ecosystem is maturing rapidly, with companies like Revolut, Lovable, and Legora demonstrating that world-class technology businesses can be built and scaled on the continent. While the US remains the dominant force in venture-backed software as home to the largest markets, the deepest capital pools, and the most ambitious exit culture, a growing number

The post The European Startup Scene appeared first on Software Engineering Daily.

3 days, 6 hours назад @ softwareengineeringdaily.com
React Native at Scale
React Native at Scale

React Native is an open source framework developed by Meta that allows engineers to build mobile applications for both iOS and Android using a single JavaScript codebase. The framework bridges the gap between web development and native mobile, which lets teams ship to both platforms simultaneously without sacrificing the look and feel of a truly

The post React Native at Scale appeared first on Software Engineering Daily.

1 week, 1 day назад @ softwareengineeringdaily.com
Formal Methods as Agent Guardrails
Formal Methods as Agent Guardrails

Formal methods are a branch of mathematics and computer science focused on proving the correctness of systems, and they have long promised a more rigorous foundation for software. However, their complexity has kept them confined to a small community of specialists. That is now changing as agentic AI systems take on increasingly autonomous roles. The

The post Formal Methods as Agent Guardrails appeared first on Software Engineering Daily.

1 week, 3 days назад @ softwareengineeringdaily.com
Open Source Sustainability
Open Source Sustainability

Open source software underpins nearly every modern application, including frameworks powering the most popular websites, to the libraries securing financial backend systems. However, while open source drives collaboration and innovation at a global scale, it also faces deep challenges in sustainability, community health, and long-term maintenance. Many of the world’s most critical dependencies are still

The post Open Source Sustainability appeared first on Software Engineering Daily.

2 weeks, 1 day назад @ softwareengineeringdaily.com
Vespa AI and Surpassing the Limits of Vector Search
Vespa AI and Surpassing the Limits of Vector Search

Vector search has risen to become a foundational tool in modern search and retrieval systems, including the RAG pipelines that power many AI applications. However, the demands on retrieval systems are growing more sophisticated, which is revealing the limits of relying on a single vector similarity score. Vespa is a popular open source search and

The post Vespa AI and Surpassing the Limits of Vector Search appeared first on Software Engineering Daily.

2 weeks, 3 days назад @ softwareengineeringdaily.com
SED News: Anthropic’s Mythos, Supply Chain Hacks, and the AI Spending Surge
SED News: Anthropic’s Mythos, Supply Chain Hacks, and the AI Spending Surge

SED News is a monthly podcast from Software Engineering Daily where hosts Gregor Vand and Sean Falconer unpack the biggest stories shaping software engineering, Silicon Valley, and the broader tech industry. In this episode, they cover Anthropic’s controversial “Mythos” security model and what it means for vulnerability discovery at scale. They also discuss recent layoffs

The post SED News: Anthropic’s Mythos, Supply Chain Hacks, and the AI Spending Surge appeared first on Software Engineering Daily.

3 weeks, 1 day назад @ softwareengineeringdaily.com
SmartBear and Multi-Agent QA
SmartBear and Multi-Agent QA

AI coding tools have dramatically accelerated the pace of development, and the bottleneck in the software development lifecycle has shifted to code validation and testing. However, the conventional tools and workflows that QA teams have relied on were not designed for a world where a single engineer can generate thousands of lines of code in

The post SmartBear and Multi-Agent QA appeared first on Software Engineering Daily.

3 weeks, 3 days назад @ softwareengineeringdaily.com
The Ethics of Autonomous Weapons Systems
The Ethics of Autonomous Weapons Systems

Artificial intelligence is transforming warfare faster than the legal and ethical frameworks designed to govern it. Militaries around the world are deploying AI-powered decision support systems to identify targets, assess proportionality, and direct weapons. The gap between what is technically possible and what international law can effectively regulate is widening by the day. Yuval Shany

The post The Ethics of Autonomous Weapons Systems appeared first on Software Engineering Daily.

4 weeks, 1 day назад @ softwareengineeringdaily.com
Open-Weight AI Models
Open-Weight AI Models

Open-weight models are AI systems whose trained parameters are publicly released, which allows developers to run, fine-tune, and deploy them independently rather than accessing them only through a hosted API. While closed-weight models from companies like OpenAI or Anthropic are delivered as managed services, open-weight models give organizations direct control over how the models are

The post Open-Weight AI Models appeared first on Software Engineering Daily.

1 month назад @ softwareengineeringdaily.com
Hype and Reality of the AI Coding Shift
Hype and Reality of the AI Coding Shift

AI coding tools have gone from novelty to core infrastructure in under three years. Today, many devs use AI daily, a substantial share of new code is AI-generated, and expectations for automation are rapidly increasing. Sonar is a company specializing in analysis of code quality and security, and they recently released a new survey –

The post Hype and Reality of the AI Coding Shift appeared first on Software Engineering Daily.

1 month назад @ softwareengineeringdaily.com
Unlocking the Data Layer for Agentic AI with Simba Khadder
Unlocking the Data Layer for Agentic AI with Simba Khadder

AI agents are increasingly capable of reasoning and performing autonomous work over long periods. However, as agents take on more complex, longer-horizon tasks, keeping them supplied with the right information becomes the core engineering challenge. The industry is moving away from pre-loading context upfront toward a model where agents dynamically navigate and retrieve the data

The post Unlocking the Data Layer for Agentic AI with Simba Khadder appeared first on Software Engineering Daily.

1 month, 1 week назад @ softwareengineeringdaily.com
Agentic Mesh with Eric Broda
Agentic Mesh with Eric Broda

AI agents are evolving from individual productivity tools into distributed systems components inside enterprises. The next frontier is coming into focus, and it involves large-scale ecosystems of collaborating agents embedded directly into business processes. However, multi-agent architectures introduce serious challenges around orchestration, state management, trust, governance, and observability. Eric Broda is a veteran of the

The post Agentic Mesh with Eric Broda appeared first on Software Engineering Daily.

1 month, 1 week назад @ softwareengineeringdaily.com
New Relic and Agentic DevOps with Nic Benders
New Relic and Agentic DevOps with Nic Benders

Observability emerged from the need to understand complex software systems, and involves tracking metrics, logs, and traces so engineers can detect and diagnose problems before they affect users. However, modern applications often encompass hundreds of services, containers, and dependencies, generating more observability data than dashboards and alerts alone can effectively surface. New Relic is a

The post New Relic and Agentic DevOps with Nic Benders appeared first on Software Engineering Daily.

1 month, 2 weeks назад @ softwareengineeringdaily.com
Mobile App Security with Ryan Lloyd
Mobile App Security with Ryan Lloyd

Mobile apps have become a primary interface for critical services, including banking, payments, and healthcare. Unlike web applications, much of the logic and intellectual property in a mobile app lives directly on the user’s device, which is an environment the developer doesn’t control. That makes mobile apps uniquely exposed to reverse engineering, runtime manipulation, and

The post Mobile App Security with Ryan Lloyd appeared first on Software Engineering Daily.

1 month, 2 weeks назад @ softwareengineeringdaily.com
Habr Podcasts Habr Podcasts
последний пост None
Мысли и Методы Мысли и Методы
последний пост None
Трёп Себранта Трёп Себранта
последний пост 5 months, 3 weeks назад
По волнам моей памяти: от YACm-2016 до YACe-2025
По волнам моей памяти: от YACm-2016 до YACe-2025 По волнам моей памяти: от YACm-2016 до YACe-2025

-=Выпуск 81=- В 2016 мы впервые придумали, как красиво и доходчиво демонстрировать достижения тогдашнего генеративного ИИ: в финале маркетингового YACm Саша и Ваня исполнили песню с альбома "Нейронная оборона", написанную тогдашним ИИ. Финал образовательного YACe нынешнего, 2025-го, года прошел в оживленной дискуссии с ИИ, который помогает Леше Комиссарову вести семинары (а иногда и вовсе его замещает). Между двумя этими точками были девять очень интересных лет. Аудиозаписи нескольких событий я собрал в этот выпуск и добавил, как положено, некоторое количество собственного трепа. Некоторые полезные ссылки по теме: Предыдущий наш подкаст с Лешей YAC/m-2016 YAC/e-2025

5 months, 3 weeks назад @ sebrant.chat
Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании
Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании

-=Выпуск 80=- Леша — биолог, который при этом читает в ИТМО курс “Программирование на естественном языке” — и это не хайп вокруг вайб-кодинга, а обучение новым практикам научной работы во времена ИИ. Для Леши важно общаться с окружающими его ИИ голосом, и это оказалось очень удобно для подкаста: к нашей беседе подключались его ИИ-агенты; разговор это заметно оживляло. Говорили мы про ИИ, но нынче это означает, что говорили про жизнь. Очень люблю лешино самопредставление на : Your AI Ever Surprised You? I Study Why | Building Consciousness-First Agents | Consciousness Through Dialogue | Genomics → Machine Minds

7 months, 4 weeks назад @ sebrant.chat
⌨ Coding
Martin Fowler
последний пост 1 day, 19 hours назад
Fragments: May 27
Fragments: May 27 Fragments: May 27

 ❄                ❄                ❄                ❄                ❄Back in the land of my birth, there was some notable groans when the National Health Service decided to close nearly all of their Open Source repositories, supposedly to the security threat of LLMs.

 ❄                ❄                ❄                ❄                ❄I’ve seen a few cases where those developers who are most involved in working with LLMs find they are running into a problem with cognitive endurance, Adam Tornhill has joined this group:One of the big wins w…

1 day, 19 hours назад @ martinfowler.com
The test suite as a regression sensor
The test suite as a regression sensor The test suite as a regression sensor

Overview of all sensors used Figure 2: Where sensors can run: during the initial coding session, in the pipeline, on a schedule, and in production.

Static code analysis: Basic linting I'll start with my learnings from using ESLint in this application.

Static code analysis has been around for a long time, and yet, teams often didn't use it consistently, even when they had it set up.

Static code analysis: Dependency rules Basic linting is mostly focussed on quality and complexity within a file or function.

That is just one of many examples where AI helped me help AI.

2 days назад @ martinfowler.com
The VibeSec Reckoning
The VibeSec Reckoning The VibeSec Reckoning

Neil is an AI Engineer in Global Marketing at Thoughtworks, specialising in data engineering, multi-agent systems, and research into new AI capabilities.

Gautam is Head of AI applications, Global Marketing at Thoughtworks.

He leads AI platform initiatives and applied AI engineering teams focused on building and scaling production-ready, token-efficient GenAI applications across the Google ecosystem.

A security context file We compiled our technical security rules into a structured context file loaded into every AI coding session before any code is written.

Feed security rules into the application builder (Cursor, Claude etc) Compile your organisation's technical security rules into a struct…

2 days, 1 hour назад @ martinfowler.com
Bliki: Vibe Coding
Bliki: Vibe Coding Bliki: Vibe Coding

Vibe coding is building a software application by prompting an LLM, telling it what to build, trying it out, prompting for changes - but without looking at any of the code that the LLM generates.

I'm building a project or webapp, but it's not really coding - I just see stuff, say stuff, run stuff, and copy paste stuff, and it mostly works.

-- Andrej KarpathyThe key point about vibe coding is “forget that the code even exists”.

Vibe coding is still new, so we are exploring its limitations, and those limitations change as the sophistication of models and their harnesses change.

On the whole vibe coding software is best used for disposable software that's only used by its author or a close…

1 week, 1 day назад @ martinfowler.com
Three more static code analysis sensors
Three more static code analysis sensors Three more static code analysis sensors

Risk profiles and goals for using AI coding agents vary depending on the software that is being built.

Overview of all sensors used Figure 2: Where sensors can run: during the initial coding session, in the pipeline, on a schedule, and in production.

Static code analysis: Basic linting I'll start with my learnings from using ESLint in this application.

Static code analysis: Coupling data Next, I experimented with the extraction of typical coupling metrics from my codebase, i.e.

Better interpretation of acceptable high-import-count “hubs” - Remember the “god classes” found by my previous coupling analysis?

1 week, 2 days назад @ martinfowler.com
Maintainability sensors for coding agents
Maintainability sensors for coding agents Maintainability sensors for coding agents

Risk profiles and goals for using AI coding agents vary depending on the software that is being built.

In this article, I describe my experimentation with various sensors that help us and AI reflect on the maintainability of a codebase, and what I learned from that.

Overview of all sensors used Figure 2: Where sensors can run: during the initial coding session, in the pipeline, on a schedule, and in production.

Static code analysis: Basic linting I'll start with my learnings from using ESLint in this application.

Guidance for self-correction A sensor is meant to give the agent feedback so that it can self-correct.

1 week, 2 days назад @ martinfowler.com
Fragments: May 14
Fragments: May 14 Fragments: May 14

 ❄                ❄                ❄                ❄                ❄Back at my deskThere’s been a bunch of questions about the article on Structured-Prompt-Driven Development (SPDD) that the authors answered in a Q&A section.

 ❄                ❄                ❄                ❄                ❄In some strange way I injured my elbow last week.

 ❄                ❄                ❄                ❄                ❄James Pritchard thinks that many developers are over-u…

2 weeks назад @ martinfowler.com
Bliki: Interrogatory LLM
Bliki: Interrogatory LLM Bliki: Interrogatory LLM

A striking element of his approach is insisting that the LLM ask only one question at a time.

Another way to use an interrogatory LLM is to give it a document, such as a software specification, that captures knowledge about a domain - and then ask the LLM to interview a human expert to determine if the document is accurate.

Naturally we can use both of these, using one interrogatory LLM to build a document, then using other interrogatory LLMs to review it with other experts.

The above is getting an LLM to create or assess context for a particular use of an LLM.

Maybe such people would find it easier to ask an LLM to interview them than to write a document themselves.

2 weeks, 1 day назад @ martinfowler.com
What is Code
What is Code What is Code

This forces a deeper question: If producing code becomes cheaper, what remains valuable about code?

Two Aspects of Code Code has always served two distinct but intertwined purposes.

Vocabulary in Code A well designed codebase is a representation of a certain vocabulary.

When we are doing web development for the retail domain, the code contains concepts that map retail domain to web domain.

Code as a shared Conceptual Model As we discussed in Designing Abstractions with LLMs, writing code has two deeply interwoven activities: discovering and applying abstractions.

2 weeks, 3 days назад @ martinfowler.com
Fragments: May 5
Fragments: May  5 Fragments: May 5

 ❄                ❄                ❄                ❄                ❄This is also a good point to note that the article by my colleagues Wei Zhang and Jessie Jie Xia on Structured-Prompt-Driven Development (SPDD) has generated an enormous amount of traffic, and quite a few questions.

 ❄                ❄                ❄                ❄                ❄Jessica Kerr (Jessitron) posted a merry tidbit of building a tool to work with conversation logs.

 ❄                ❄                ❄          …

3 weeks, 2 days назад @ martinfowler.com
Bliki: Mythical Man Month
Bliki: Mythical Man Month Bliki: Mythical Man Month

After it was done he penned his thoughts in the book The Mythical Man-Month which became one of the most influential books on software development after its publication in 1975.

Perhaps my most enduring lesson from this book is the importance of conceptual integrityI will contend that conceptual integrity is the most important consideration in system design.

He argues that conceptual integrity comes from both simplicity and straightforwardness - the latter being how easily we can compose elements.

This point of view has been a strong influence upon my career, the pursuit of conceptual integrity underpins much of my work.

The anniversary edition of this book is the one to get, because it als…

3 weeks, 2 days назад @ martinfowler.com
Fragments: April 29
Fragments: April 29 Fragments: April 29

 ❄                ❄                ❄                ❄                ❄Early this month Birgitta Böckeler wrote a superb article on Harness Engineering.

 ❄                ❄                ❄                ❄                ❄Adam Tornhill considers an age-old question: how long should a function be?

 ❄                ❄                ❄                ❄                ❄Many folks in my feeds recommended Nilay Patel’s post on Why People Hate AI.

 ❄          …

1 month назад @ martinfowler.com
Structured-Prompt-Driven Development (SPDD)
Structured-Prompt-Driven Development (SPDD) Structured-Prompt-Driven Development (SPDD)

That led our Thoughtworks internal IT teams (Global IT Services) to a method and workflow we now call Structured Prompt-Driven Development (SPDD).

It introduces split billing, where prompt tokens and completion tokens are charged separately at different rates depending on the model used.

Premium Plan billing: A customer submits 10K prompt tokens + 20K completion tokens for reasoning-model (prompt $0.03/1K, completion $0.06/1K).

Generate the initial test prompt We begin by combining the implementation details with our standardized testing template to generate a baseline test prompt.

Deduplicate and refine scenarios After generating the initial structured test prompt, some of the proposed tes…

1 month назад @ martinfowler.com
Fragments: April 21
Fragments: April 21 Fragments: April 21

Martin Fowler: 21 Apr 2026Last week Thoughtworks released the 34th volume of our Technology Radar.

 ❄                ❄                ❄                ❄                ❄Mike Mason looks what happens when developers aren’t reading the code.

As well as the experience of “a friend”, he ponders the 500,000 lines of Claude Code after the leak.

 ❄                ❄                ❄                ❄                ❄Dan Davies poses an annoying philosophy thought experiment for us to consider how we feel about LLMs indulging in ghost writing.

 â…

1 month, 1 week назад @ martinfowler.com
Fragments: April 14
Fragments: April 14 Fragments: April 14

Martin Fowler: 14 Apr 2026I attended the first Pragmatic Summit early this year, and while there host Gergely Orosz interviewed Kent Beck and myself on stage.

 ❄                ❄                ❄                ❄                ❄Perl is a language I used a little, but never loved.

) — to develop the powerful abstractions that then allow us to do much more, much more easily.

 ❄                ❄                ❄                ❄                ❄Jessica Kerr (Jessitron) has a simple example of applying the principle of Test-Driven Developme…

1 month, 2 weeks назад @ martinfowler.com
Антон Жиянов Антон Жиянов
последний пост 5 months, 1 week назад
Go-фича: Обновленный go fix
Go-фича: Обновленный go fix Go-фича: Обновленный go fix

КакНовая команда go fix :usage: go fix [build flags] [-fixtool prog] [fix flags] [packages] Fix runs the Go fix tool (cmd/fix) on the named packages and applies suggested fixes.

Index ( s , " " ) if idx == - 1 { return s } return strings .

ReplaceAll ( s , " " , "" ) }// after func nospace ( s string ) string { found := strings .

found { return s } return strings .

TrimPrefix ( s , "> " ) } return s }// after func unindent ( s string ) string { if after , ok := strings .

5 months, 1 week назад @ antonz.ru
Утечки горутин в Go 1.24+
Утечки горутин в Go 1.24+ Утечки горутин в Go 1.24+

Вы конечно и так в курсе, но на всякий случай:Утрированный пример утечки:Традиционно Go не очень-то помогал в поиске утечек.

Обнаружить их можно было разве что пристально разглядывая профиль или трассировку с продакшена, а в тестах приходилось использовать сторонний пакет goleak от Убера.

Сейчас это меняется.

Сначала в Go 1.24 добавили пакет synctest, который прекрасно справляется с поиском утечек при тестировании.

Об этом почему-то никто не говорит — наверно, потому что не проходили мой курс по многозадачности 😁

5 months, 1 week назад @ antonz.ru
Go-фича: Защита секретов
Go-фича: Защита секретов Go-фича: Защита секретов

// Do invokes f.//// Do ensures that any temporary storage used by f is erased in a// timely manner.

(In this context, "f" is shorthand for the// entire call tree initiated by f.)// - Any registers used by f are erased before Do returns.

// - Any stack used by f is erased before Do returns.

// - Any heap allocation done by f is erased as soon as the garbage// collector realizes that it is no longer reachable.

As part of// that, any panic raised by f will appear as if it originates from// Do itself.

5 months, 3 weeks назад @ antonz.ru
Go-фича: Безопасная проверка ошибок
Go-фича: Безопасная проверка ошибок Go-фича: Безопасная проверка ошибок

// AsType finds the first error in err's tree that matches the type E,// and if one is found, returns that error value and true.

//// The tree consists of err itself, followed by the errors obtained by// repeatedly calling its Unwrap() error or Unwrap() []error method.

// When err wraps multiple errors, AsType examines err followed by a// depth-first traversal of its children.

//// An error err matches the type E if the type assertion err.

(E) holds,// or if the error has a method As(any) bool such that err.As(target)// returns true when target is a non-nil *E. In the latter case, the As// method is responsible for setting target.

5 months, 4 weeks назад @ antonz.ru
Курс: Знакомство с Go
Курс: Знакомство с Go Курс: Знакомство с Go

Для всех, кто уверенно программирует на другом языке и хочет попробовать Go.

6 months назад @ antonz.ru
Go-фича: Метрики горутин
Go-фича: Метрики горутин Go-фича: Метрики горутин

Подробные метрики горутин от рантайма.

Метрики по состояниям горутин помогают находить типичные проблемы в продакшене.

Много горутин в состоянии not-in-go — значит, они застряли в системных вызовах или cgo.

Добавить следующие метрики в пакет runtime/metrics :Сумма значений показателей по каждому состоянию не обязательно равна общему количеству активных горутин (метрика /sched/goroutines:goroutines , доступна в Go 1.16+).

Запускаем несколько горутин и выводим метрики через 100 мс работы:

6 months назад @ antonz.ru
Go-фича: Dialer с контекстом
Go-фича: Dialer с контекстом Go-фича: Dialer с контекстом

Новые методы Dialer с поддержкой контекста — DialTCP , DialUDP , DialIP и DialUnix — объединяют эффективную реализацию (как в существующих Dial -функциях) с возможностью отмены (как в Dialer.DialContext ).

Он поддерживает отмену и может использоваться для подключения по любому из поддерживаемых протоколов:func ( d * Dialer ) DialContext ( ctx context .

Context , network string , laddr , raddr netip .

Context , network string , laddr , raddr netip .

Context , network string , laddr , raddr netip .

6 months, 2 weeks назад @ antonz.ru
Go-фича: Сравнение IP-подсетей
Go-фича: Сравнение IP-подсетей Go-фича: Сравнение IP-подсетей

Как это делают IANA и Python.

7 months, 1 week назад @ antonz.ru
Go-фича: Хешеры
Go-фича: Хешеры Go-фича: Хешеры

// Hasher реализует хеширование и проверку на равенство для типа T. type Hasher [ T any ] interface { Hash ( hash * maphash .

// То есть, если Equal(a, b) возвращает true, то Hash(h, a) и Hash(h, b) // должны записывать одинаковые данные в h. Hash ( hash * maphash .

Hasher [ V ], V any ]( hasher H ) * Set [ H , V ] { return & Set [ H , V ]{ seed : maphash .

func ( s * Set [ H , V ]) calcHash ( val V ) uint64 { var h maphash .

func ( s * Set [ H , V ]) Has ( val V ) bool { hash := s . calcHash ( val ) if bucket , ok := s . data [ hash ]; ok { for _ , item := range bucket { if s . hasher .

8 months назад @ antonz.ru
Go-фича: new(expr)
Go-фича: new(expr) Go-фича: new(expr)

Println ( * p1 ) // 0А теперь можно и с выражениями:// Указатель на переменную типа int со значением 42. p := new ( 42 ) fmt .

Println ( * p2 )42 go// go 1.26 p1 := new ( 42 ) fmt .

Println ( * p2 )42 goУказатель на составное значение:// go 1.25 s := [] int { 11 , 12 , 13 } p1 := & s fmt .

Println ( * p )go// go 1.26 f := func () string { return "go" } p := new ( f ()) fmt .

Println ( * p )goПередавать nil по-прежнему нельзя:// go 1.25 and go 1.26 p := new ( nil ) // compilation errorСсылки𝗣 45624 • 𝗖𝗟 704935, 704737, 704955, 705157

8 months, 1 week назад @ antonz.ru