Data Engineering
про инжиниринг данных и аналитику
🏢 %company% Engineering
AirBnb Engineering
последний пост 1 week, 6 days назад
Load Testing with Impulse at Airbnb
Load Testing with Impulse at Airbnb Load Testing with Impulse at Airbnb

Comprehensive Load Testing with Load Generator, Dependency Mocker, Traffic Collector, and MoreAuthors: Chenhao Yang, Haoyue Wang, Xiaoya Wei, Zay Guan, Yaolin Chen and Fei YuanSystem-level load testing is crucial for reliability and efficiency. It identifies bottlenecks, evaluates capacity for peak traffic, establishes performance baselines, and detects errors. At a company of Airbnb’s size and complexity, we’ve learned that load testing needs to be robust, flexible, and decentralized. This requires the right set of tools to enable engineering teams to do self-service load tests that integrate seamlessly with CI.Impulse is one of our internal load-testing-as-a-service frameworks. It provide…

1 week, 6 days назад @ medium.com
Listening, Learning, and Helping at Scale: How Machine Learning Transforms Airbnb’s Voice Support…
Listening, Learning, and Helping at Scale: How Machine Learning Transforms Airbnb’s Voice Support… Listening, Learning, and Helping at Scale: How Machine Learning Transforms Airbnb’s Voice Support…

Listening, Learning, and Helping at Scale: How Machine Learning Transforms Airbnb’s Voice Support ExperienceA look into how Airbnb uses speech recognition, intent detection, and language models to understand users and assist agents more effectively.By Yuanpei Cao, Heng Ji, Elaine Liu, Peng Wang, and Tiantian ZhangAt Airbnb, we aim to provide a smooth, intuitive, and helpful community support experience, whether it’s helping a guest navigate a booking change or helping a host with a listing issue. While our Help Center and customer support chatbot helps resolve many inquiries efficiently, some users prefer the immediacy of a voice conversation with a support representative. To make these int…

3 weeks, 3 days назад @ medium.com
How Airbnb Measures Listing Lifetime Value
How Airbnb Measures Listing Lifetime Value How Airbnb Measures Listing Lifetime Value

A deep dive on the framework that lets us identify the most valuable listings for our guests.By: Carlos Sanchez-Martinez, Sean O’Donnell, Lo-Hua Yuan, Yunshan ZhuAt Airbnb, we always strive to provide our community with the best experience. To do so, it’s important to understand what kinds of accommodation listings are valuable to our guests. We achieve this by calculating and using estimates of listing lifetime value. These estimates not only allow us to identify which types of listings resonate best with guests, but also help us develop resources and recommendations for hosts to increase the value driven by their listings.Most of the existing literature on lifetime value focuses on tradit…

2 months, 4 weeks назад @ medium.com
Embedding-Based Retrieval for Airbnb Search
Embedding-Based Retrieval for Airbnb Search Embedding-Based Retrieval for Airbnb Search

Our journey in applying embedding-based retrieval techniques to build an accurate and scalable candidate retrieval system for Airbnb Homes searchAuthors: Mustafa (Moose) Abdool, Soumyadip Banerjee, Karen Ouyang, Do-Kyum Kim, Moutupsi Paul, Xiaowei Liu, Bin Xu, Tracy Yu, Hui Gao, Yangbo Zhu, Huiji Gao, Liwei He, Sanjeev KatariyaIntroductionSearch plays a crucial role in helping Airbnb guests find the perfect stay. The goal of Airbnb Search is to surface the most relevant listings for each user’s query — but with millions of available homes, that’s no easy task. It’s especially difficult when searches include large geographic areas (like California or France) or high-demand destinations (like…

3 months назад @ medium.com
Accelerating Large-Scale Test Migration with LLMs
Accelerating Large-Scale Test Migration with LLMs Accelerating Large-Scale Test Migration with LLMs

by: Charles Covey-BrandtAirbnb recently completed our first large-scale, LLM-driven code migration, updating nearly 3.5K React component test files from Enzyme to use React Testing Library (RTL) instead. We’d originally estimated this would take 1.5 years of engineering time to do by hand, but — using a combination of frontier models and robust automation — we finished the entire migration in just 6 weeks.In this blog post, we’ll highlight the unique challenges we faced migrating from Enzyme to RTL, how LLMs excel at solving this particular type of challenge, and how we structured our migration tooling to run an LLM-driven migration at scale.BackgroundIn 2020, Airbnb adopted React Testing L…

3 months, 1 week назад @ medium.com
Improving Search Ranking for Maps
Improving Search Ranking for Maps Improving Search Ranking for Maps

How Airbnb is adapting ranking for our map interface.Malay Haldar, Hongwei Zhang, Kedar Bellare Sherry ChenSearch is the core mechanism that connects guests with Hosts at Airbnb. Results from a guest’s search for listings are displayed through two interfaces: (1) as a list of rectangular cards that contain the listing image, price, rating, and other details on it, referred to as list-results and (2) as oval pins on a map showing the listing price, called map-results. Since its inception, the core of the ranking algorithm that powered both these interfaces was the same — ordering listings by their booking probabilities and selecting the top listings for display.But some of the basic assumpti…

6 months назад @ medium.com
Airbnb at KDD 2024
Airbnb at KDD 2024 Airbnb at KDD 2024

Airbnb had a large presence at the 2024 KDD conference hosted in Barcelona, Spain. Our Data Scientist and Engineers presented on topics like Deep Learning & Search Ranking, Online Experimentation & Measurement, Product Quality & Customer Journey, and Two-sided Marketplaces. This blog post summarizes our contributions to KDD for 2024 and provides access to the academic papers presented during the conference.Authors: Huiji Gao, Peter Coles, Carolina Barcenas, Sanjeev KatariyaKDD (Knowledge and Data Mining) is one of the most prestigious global conferences in data mining and machine learning. Hosted annually by a special interest group of the Association for Computing Machinery (ACM), it’s whe…

6 months, 1 week назад @ medium.com
My Journey To Airbnb | Vijaya Kaza
My Journey To Airbnb | Vijaya Kaza My Journey To Airbnb | Vijaya Kaza

Vijaya Kaza is the Chief Security Officer and Head of Engineering for Trust and Safety at Airbnb. She leads teams responsible for developing the technology (Platforms, tools and AI models), to safeguard the Airbnb community, as well as for securing Airbnb’s infrastructure and information assets. She is also the executive co-sponsor of Airbnb Tech’s Diversity Council.Here’s Vijaya’s story of how she got to Airbnb, in her own words.Straight shot to science and engineeringI grew up in a modest, multi-generational family in India with 30 to 40 family members under one roof on any given day. As the oldest child in that house, I was expected to excel academically and set an example for the other …

6 months, 2 weeks назад @ medium.com
From Data to Insights: Segmenting Airbnb’s Supply
From Data to Insights: Segmenting Airbnb’s Supply From Data to Insights: Segmenting Airbnb’s Supply

How Airbnb uses data-driven segmentation to understand supply availability patterns.By: Alexandre Salama, Tim AbrahamIntroductionAt Airbnb, our supply comes from hosts who decide to list their spaces on our platform. Unlike traditional hotels, these spaces are not all interchangeable units in a building that are available to book year-round. Our hosts are people, with different earnings objectives and schedule constraints — leading to different levels of availability to host. Understanding these differences is a key input into how we develop our products, campaigns, and operations.Over the years, we’ve created various ways to measure host availability, developing “features” that capture dif…

6 months, 4 weeks назад @ medium.com
Building a User Signals Platform at Airbnb
Building a User Signals Platform at Airbnb Building a User Signals Platform at Airbnb

How Airbnb built a stream processing platform to power user personalization.By: Kidai Kwon, Pavan Tambay, Xinrui Hua, Soumyadip (Soumo) Banerjee, Phanindra (Phani) GantiOverviewUnderstanding user actions is critical for delivering a more personalized product experience. In this blog, we will explore how Airbnb developed a large-scale, near real-time stream processing platform for capturing and understanding user actions, which enables multiple teams to easily leverage real-time user activities. Additionally, we will discuss the challenges encountered and valuable insights gained from operating a large-scale stream processing platform.BackgroundAirbnb connects millions of guests with unique …

7 months назад @ medium.com
Airbnb’s AI-powered photo tour using Vision Transformer
Airbnb’s AI-powered photo tour using Vision Transformer Airbnb’s AI-powered photo tour using Vision Transformer

Boosting computer vision accuracy and performance at AirbnbBy: Pei Xiong, Aaron Yin, Jian Zhang, Lifan Yang, Lu Zhang, Dean ChenIntroductionIn recent years, the integration of artificial intelligence with travel platforms has transformed how people search for and book accommodations. As a leading global marketplace for unique travel experiences and accommodations, Airbnb constantly strives to enhance the guest experience by providing informative content about the variety of homes shared by our hosts. One of the ways we help guests better understand what a listing offers before they book is through our AI-powered photo tour feature.The AI-powered photo tour in the Listings tab, which helps h…

7 months, 1 week назад @ medium.com
Adopting Bazel for Web at Scale
Adopting Bazel for Web at Scale Adopting Bazel for Web at Scale

How and Why We Migrated Airbnb’s Large-Scale Web Monorepo to BazelBy: Brie Bunge and Sharmila JesupaulIntroductionAt Airbnb, we’ve recently adopted Bazel — Google’s open source build tool–as our universal build system across backend, web, and iOS platforms. This post will cover our experience adopting Bazel for Airbnb’s large-scale (over 11 million lines of code) web monorepo. We’ll share how we prepared the code base, the principles that guided the migration, and the process of migrating selected CI jobs. Our goal is to share information that would have been valuable to us when we embarked on this journey and to contribute to the growing discussion around Bazel for web development.Why did …

7 months, 1 week назад @ medium.com
Transforming Location Retrieval at Airbnb: A Journey from Heuristics to Reinforcement Learning
Transforming Location Retrieval at Airbnb: A Journey from Heuristics to Reinforcement Learning Transforming Location Retrieval at Airbnb: A Journey from Heuristics to Reinforcement Learning

How Airbnb leverages machine learning and reinforcement learning techniques to solve a unique information retrieval task in order to provide guests with unique, affordable, and differentiated accommodations around the world.By: Dillon Davis, Huiji Gao, Thomas Legrand, Weiwei Guo, Malay Haldar, Alex Deng, Han Zhao, Liwei He, Sanjeev KatariyaIntroductionAirbnb has transformed the way people travel around the globe. As Airbnb’s inventory spans diverse locations and property types, providing guests with relevant options in their search results has become increasingly complex. In this blog post, we’ll discuss shifting from using simple heuristics to advanced machine learning and reinforcement le…

7 months, 1 week назад @ medium.com
Automation Platform v2: Improving Conversational AI at Airbnb
Automation Platform v2: Improving Conversational AI at Airbnb Automation Platform v2: Improving Conversational AI at Airbnb

How Airbnb’s conversational AI platform powers LLM application development.By Chutian Wang, Zhiheng Xu, Paul Lou, Ziyi Wang, Jiayu Lou, Liuming Zhang, Jingwen Qiang, Clint Kelly, Lei Shi, Dan Zhao, Xu Hu, Jianqi Liao, Zecheng Xu, Tong ChenIntroductionArtificial intelligence and large language models (LLMs) are a rapidly evolving sector at the forefront of technological innovation. AI’s capacity for logical reasoning and task completion is changing the way we interact with technology.In this blog post, we will showcase how we advanced Automation Platform, Airbnb’s conversational AI platform, from version 1, which supported conversational systems driven by static workflows, to version 2, whic…

7 months, 3 weeks назад @ medium.com
Sandcastle: data/AI apps for everyone
Sandcastle: data/AI apps for everyone Sandcastle: data/AI apps for everyone

Airbnb made it easy to bring data/AI ideas to life through a platform for prototyping web applications.By: Dan MillerWarm, friendly beach capturing the playful nature of prototyping.IntroductionTrustworthy data has always been a part of Airbnb’s technical DNA. However, it is challenging for our data scientists and ML practitioners to bring data- and AI-powered product ideas to life in a way that resonates with our design-focused leadership. Slide decks with screenshots, design documents with plots, and even Figmas are insufficient to capture ideas that need to be experienced in order to be understood. This was especially true as large language models (LLMs) took the world by storm, since th…

9 months назад @ medium.com
Netflix Engineering Netflix Engineering
последний пост 1 week, 3 days назад
Model Once, Represent Everywhere: UDA (Unified Data Architecture) at Netflix
Model Once, Represent Everywhere: UDA (Unified Data Architecture) at Netflix Model Once, Represent Everywhere: UDA (Unified Data Architecture) at Netflix

By Alex Hutter, Alexandre Bertails, Claire Wang, Haoyuan He, Kishore Banala, Peter Royal, Shervin AfsharAs Netflix’s offerings grow — across films, series, games, live events, and ads — so does the complexity of the systems that support it. Core business concepts like ‘actor’ or ‘movie’ are modeled in many places: in our Enterprise GraphQL Gateway powering internal apps, in our asset management platform storing media assets, in our media computing platform that powers encoding pipelines, to name a few. Each system models these concepts differently and in isolation, with little coordination or shared understanding. While they often operate on the same concepts, these systems remain largely u…

1 week, 3 days назад @ netflixtechblog.com
FM-Intent: Predicting User Session Intent with Hierarchical Multi-Task Learning
FM-Intent: Predicting User Session Intent with Hierarchical Multi-Task Learning FM-Intent: Predicting User Session Intent with Hierarchical Multi-Task Learning

Authors: Sejoon Oh, Moumita Bhattacharya, Yesu Feng, Sudarshan Lamkhede, Ko-Jen Hsiao, and Justin BasilicoMotivationRecommender systems have become essential components of digital services across e-commerce, streaming media, and social networks [1, 2]. At Netflix, these systems drive significant product and business impact by connecting members with relevant content at the right time [3, 4]. While our recommendation foundation model (FM) has made substantial progress in understanding user preferences through large-scale learning from interaction histories (please refer to this article about FM @ Netflix), there is an opportunity to further enhance its capabilities. By extending FM to incorp…

1 month назад @ netflixtechblog.com
Behind the Scenes: Building a Robust Ads Event Processing Pipeline
Behind the Scenes: Building a Robust Ads Event Processing Pipeline Behind the Scenes: Building a Robust Ads Event Processing Pipeline

Kinesh SatiyaIntroductionIn a digital advertising platform, a robust feedback system is essential for the lifecycle and success of an ad campaign. This system comprises of diverse sub-systems designed to monitor, measure, and optimize ad campaigns. At Netflix, we embarked on a journey to build a robust event processing platform that not only meets the current demands but also scales for future needs. This blog post delves into the architectural evolution and technical decisions that underpin our Ads event processing pipeline.Ad serving acts like the “brain” — making decisions, optimizing delivery and ensuring right Ad is shown to the right member at the right time. Meanwhile, ad events, aft…

1 month, 2 weeks назад @ netflixtechblog.com
Measuring Dialogue Intelligibility for Netflix Content
Measuring Dialogue Intelligibility for Netflix Content Measuring Dialogue Intelligibility for Netflix Content

Enhancing Member Experience Through Strategic CollaborationOzzie Sutherland, Iroro Orife, Chih-Wei Wu, Bhanu SrikanthAt Netflix, delivering the best possible experience for our members is at the heart of everything we do, and we know we can’t do it alone. That’s why we work closely with a diverse ecosystem of technology partners, combining their deep expertise with our creative and operational insights. Together, we explore new ideas, develop practical tools, and push technical boundaries in service of storytelling. This collaboration not only empowers the talented creatives working on our shows with better tools to bring their vision to life, but also helps us innovate in service of our me…

1 month, 2 weeks назад @ netflixtechblog.com
How Netflix Accurately Attributes eBPF Flow Logs
How Netflix Accurately Attributes eBPF Flow Logs How Netflix Accurately Attributes eBPF Flow Logs

By Cheng Xie, Bryan Shultz, and Christine XuIn a previous blog post, we described how Netflix uses eBPF to capture TCP flow logs at scale for enhanced network insights. In this post, we delve deeper into how Netflix solved a core problem: accurately attributing flow IP addresses to workload identities.A Brief RecapFlowExporter is a sidecar that runs alongside all Netflix workloads. It uses eBPF and TCP tracepoints to monitor TCP socket state changes. When a TCP socket closes, FlowExporter generates a flow log record that includes the IP addresses, ports, timestamps, and additional socket statistics. On average, 5 million records are produced per second.In cloud environments, IP addresses ar…

2 months, 2 weeks назад @ netflixtechblog.com
Globalizing Productions with Netflix’s Media Production Suite
Globalizing Productions with Netflix’s Media Production Suite Globalizing Productions with Netflix’s Media Production Suite

Jesse Korosi, Thijs van de Kamp, Mayra Vega, Laura Futuro, Anton MargolineThe journey from script to screen is full of challenges in the ever-evolving world of film and television. The industry has always innovated, and over the last decade, it started moving towards cloud-based workflows. However, unlocking cloud innovation and all its benefits on a global scale has proven to be difficult. The opportunity is clear: streamline complex media management logistics, eliminate tedious, non-creative task-based work and enable productions to focus on what matters most–creative storytelling. With these challenges in mind, Netflix has developed a suite of tools by filmmakers for filmmakers: the Medi…

2 months, 3 weeks назад @ netflixtechblog.com
Foundation Model for Personalized Recommendation
Foundation Model for Personalized Recommendation Foundation Model for Personalized Recommendation

By Ko-Jen Hsiao, Yesu Feng and Sudarshan LamkhedeMotivationNetflix’s personalized recommender system is a complex system, boasting a variety of specialized machine learned models each catering to distinct needs including “Continue Watching” and “Today’s Top Picks for You.” (Refer to our recent overview for more details). However, as we expanded our set of personalization algorithms to meet increasing business needs, maintenance of the recommender system became quite costly. Furthermore, it was difficult to transfer innovations from one model to another, given that most are independently trained despite using common data sources. This scenario underscored the need for a new recommender syste…

2 months, 3 weeks назад @ netflixtechblog.com
HDR10+ Now Streaming on Netflix
HDR10+ Now Streaming on Netflix HDR10+ Now Streaming on Netflix

Roger Quero, Liwei Guo, Jeff Watts, Joseph McCormick, Agata Opalach, Anush MoorthyWe are excited to announce that we are now streaming HDR10+ content on our service for AV1-enabled devices, enhancing the viewing experience for certified HDR10+ devices, which previously only received HDR10 content. The dynamic metadata included in our HDR10+ content improves the quality and accuracy of the picture when viewed on these devices.Delighting Members with Even Better Picture QualityNearly a decade ago, we made a bold move to be a pioneering adopter of High Dynamic Range (HDR) technology. HDR enables images to have more details, vivid colors, and improved realism. We began producing our shows and m…

3 months назад @ netflixtechblog.com
Title Launch Observability at Netflix Scale
Title Launch Observability at Netflix Scale Title Launch Observability at Netflix Scale

Part 3: System Strategies and ArchitectureBy: Varun KhaitanWith special thanks to my stunning colleagues: Mallika Rao, Esmir Mesic, Hugo MarquesThis blog post is a continuation of Part 2, where we cleared the ambiguity around title launch observability at Netflix. In this installment, we will explore the strategies, tools, and methodologies that were employed to achieve comprehensive title observability at scale.Defining the observability endpointTo create a comprehensive solution, we decided to introduce observability endpoints first. Each microservice involved in our Personalization stack that integrated with our observability solution had to introduce a new “Title Health” endpoint. Our g…

3 months, 2 weeks назад @ netflixtechblog.com
Introducing Impressions at Netflix
Introducing Impressions at Netflix Introducing Impressions at Netflix

Part 1: Creating the Source of Truth for ImpressionsBy: Tulika BhattImagine scrolling through Netflix, where each movie poster or promotional banner competes for your attention. Every image you hover over isn’t just a visual placeholder; it’s a critical data point that fuels our sophisticated personalization engine. At Netflix, we call these images ‘impressions,’ and they play a pivotal role in transforming your interaction from simple browsing into an immersive binge-watching experience, all tailored to your unique tastes.Capturing these moments and turning them into a personalized journey is no simple feat. It requires a state-of-the-art system that can track and process these impressions…

4 months, 1 week назад @ netflixtechblog.com
Title Launch Observability at Netflix Scale
Title Launch Observability at Netflix Scale Title Launch Observability at Netflix Scale

Part 2: Navigating AmbiguityBy: Varun KhaitanWith special thanks to my stunning colleagues: Mallika Rao, Esmir Mesic, Hugo MarquesBuilding on the foundation laid in Part 1, where we explored the “what” behind the challenges of title launch observability at Netflix, this post shifts focus to the “how.” How do we ensure every title launches seamlessly and remains discoverable by the right audience?In the dynamic world of technology, it’s tempting to leap into problem-solving mode. But the key to lasting success lies in taking a step back — understanding the broader context before diving into solutions. This thoughtful approach doesn’t just address immediate hurdles; it builds the resilience a…

5 months, 2 weeks назад @ netflixtechblog.com
Part 3: A Survey of Analytics Engineering Work at Netflix
Part 3: A Survey of Analytics Engineering Work at Netflix Part 3: A Survey of Analytics Engineering Work at Netflix

This article is the last in a multi-part series sharing a breadth of Analytics Engineering work at Netflix, recently presented as part of our annual internal Analytics Engineering conference. Need to catch up? Check out Part 1, which detailed how we’re empowering Netflix to efficiently produce and effectively deliver high quality, actionable analytic insights across the company and Part 2, which stepped through a few exciting business applications for Analytics Engineering. This post will go into aspects of technical craft.Dashboard Design TipsRina Chang, Susie LuWhat is design, and why does it matter? Often people think design is about how things look, but design is actually about how thin…

5 months, 2 weeks назад @ netflixtechblog.com
Part 2: A Survey of Analytics Engineering Work at Netflix
Part 2: A Survey of Analytics Engineering Work at Netflix Part 2: A Survey of Analytics Engineering Work at Netflix

This article is the second in a multi-part series sharing a breadth of Analytics Engineering work at Netflix, recently presented as part of our annual internal Analytics Engineering conference. Need to catch up? Check out Part 1. In this article, we highlight a few exciting analytic business applications, and in our final article we’ll go into aspects of the technical craft.Game AnalyticsYimeng Tang, Claire Willeck, Sagar PalaoUser Acquisition Incrementality for Netflix GamesNetflix has been launching games for the past three years, during which it has initiated various marketing efforts, including User Acquisition (UA) campaigns, to promote these games across different countries. These UA …

5 months, 3 weeks назад @ netflixtechblog.com
Introducing Configurable Metaflow
Introducing Configurable Metaflow Introducing Configurable Metaflow

David J. Berg*, David Casler^, Romain Cledat*, Qian Huang*, Rui Lin*, Nissan Pow*, Nurcan Sonmez*, Shashank Srikanth*, Chaoying Wang*, Regina Wang*, Darin Yu**: Model Development Team, Machine Learning Platform^: Content Demand Modeling TeamA month ago at QConSF, we showcased how Netflix utilizes Metaflow to power a diverse set of ML and AI use cases, managing thousands of unique Metaflow flows. This followed a previous blog on the same topic. Many of these projects are under constant development by dedicated teams with their own business goals and development best practices, such as the system that supports our content decision makers, or the system that ranks which language subtitles are …

6 months назад @ netflixtechblog.com
Part 1: A Survey of Analytics Engineering Work at Netflix
Part 1: A Survey of Analytics Engineering Work at Netflix Part 1: A Survey of Analytics Engineering Work at Netflix

This article is the first in a multi-part series sharing a breadth of Analytics Engineering work at Netflix, recently presented as part of our annual internal Analytics Engineering conference. We kick off with a few topics focused on how we’re empowering Netflix to efficiently produce and effectively deliver high quality, actionable analytic insights across the company. Subsequent posts will detail examples of exciting analytic engineering domain applications and aspects of the technical craft.At Netflix, we seek to entertain the world by ensuring our members find the shows and movies that will thrill them. Analytics at Netflix powers everything from understanding what content will excite a…

6 months, 1 week назад @ netflixtechblog.com
Pinterest Engineering
последний пост 1 week, 3 days назад
Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads
Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads

Authors (non-ordered): Qishan(Shanna) Zhu, Chen HuAcknowledgements: Longyu Zhao, Jacob Gao, Quannan Li, Dinesh GovindarajIntroductionIn the evolving landscape of advertising, the demand for real-time personalization and dynamic ad delivery has made Online Approximate Nearest Neighbors (ANN) a mainstream method for ad retrieval. Pinterest primarily employs online ANN to swiftly adapt to users’ behavior changes (depending on their age, location and privacy settings), thereby enhancing ad responsiveness and relevance.However, offline ANN is also a valuable option, particularly when large-scale data processing, efficient resource utilization, and cost-effective operations are critical. By preco…

1 week, 3 days назад @ medium.com
Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations
Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations

Xue Xia | Machine Learning Engineer, Home Feed Ranking; Saurabh Vishwas Joshi | Principal Engineer, ML Platform; Kousik Rajesh | Machine Learning Engineer, Applied Science; Kangnan Li | Machine Learning Engineer, Core ML Infrastructure; Yangyi Lu | Machine Learning Engineer, Home Feed Ranking; Nikil Pancha | (formerly) Machine Learning Engineer, Applied Science; Dhruvil Deven Badani | Engineering Manager, Home Feed Ranking; Jiajing Xu | Engineering Manager, Applied Science; Pong Eksombatchai | Principal Machine Learning Engineer, Applied ScienceBackgroundThe Pinterest home feed is crucial for Pinner engagement and discovery. Pins on the home feed are personalized using a two-stage process: …

2 weeks, 2 days назад @ medium.com
Automated Migration and Scaling of Hadoop™ Clusters
Automated Migration and Scaling of Hadoop™ Clusters Automated Migration and Scaling of Hadoop™ Clusters

Joe Sabolefski, Sr. Site Reliability EngineerPinterest Big Data InfrastructureMuch of Pinterest’s big data is processed using frameworks like MapReduce™, Spark™, and Flink™ on Hadoop™ YARN™. The processing is carried out on many thousands of nodes spread across over a dozen clusters. We use AWS for our infrastructure, and each cluster uses Auto Scaling Groups (ASGs) to maintain cluster size. Because Hadoop is stateful, we do not auto-scale the clusters; each ASG is fixed in size (desired = min = max). Terraform is utilized to create each cluster. Before introducing the Hadoop Control Center (HCC), Terraform was also used to scale out the Auto Scaling Groups (ASGs). However, scaling in (down…

2 weeks, 3 days назад @ medium.com
Adopting Docs-as-Code at Pinterest
Adopting Docs-as-Code at Pinterest Adopting Docs-as-Code at Pinterest

Jacob Seiler | Software Engineer, Internal Tools PlatformJay Kim | Software Engineer, Internal Tools PlatformCharlie Gu | Engineering Manager, Internal Tools PlatformTechnical documentation is the backbone of any successful engineering team, yet at Pinterest, it has consistently been a source of frustration. Despite using popular web-based wiki tools and experimenting with well-known alternative applications, our internal developer surveys reveal that documentation remains a top pain point. The issues boil down to two critical areas: quality and discoverability. Traditional solutions, such as doc-a-thon sprints or passionate appeals from senior leaders, have failed to produce lasting improv…

2 weeks, 5 days назад @ medium.com
Healthier Personalization with Surveys
Healthier Personalization with Surveys Healthier Personalization with Surveys

Leif Sigerson | Senior Data Scientist, Data Platforms Science,Stephanie Chen | Staff Quantitative Product Researcher, Product Research,Wendy Matheny | Senior Lead Public Policy Manager, Government and Corporate AffairsIntroOne of the best parts about working at Pinterest is meeting someone new and telling them where you work. Often, they smile and immediately say, “I love Pinterest! I go there for…[outfit inspiration, recipes, home decor ideas, nail art, DIY projects, etc.]!” It’s a great feeling that never gets old.A major reason so many people feel good about their time on Pinterest is that it feels personal. Pinterest is personal — it’s about yourself, not your selfie.People come to Pint…

3 weeks, 2 days назад @ medium.com
Modernizing Home Feed Pre-Ranking Stage
Modernizing Home Feed Pre-Ranking Stage Modernizing Home Feed Pre-Ranking Stage

Bella Huang | Machine Learning Engineer, Homefeed Candidate GenerationDafang He | Machine Learning Engineer, Homefeed RelevanceYuying Chen | Machine Learning Engineer, (formerly) Homefeed Candidate GenerationJames Li | Engineering Manager, Homefeed Candidate GenerationDylan Wang | Director, Homefeed RelevanceModern recommendation systems typically follow a multi-stage design involving retrieval, pre-ranking, ranking, and reranking. Pinterest home feed recommendation system has similarly adopted these strategies over the years. We are excited to announce the big milestone in this journey with a sophisticated pre-ranking layer (aka Lightweight Scoring) that significantly improved our business…

3 weeks, 3 days назад @ medium.com
How Pinterest Accelerates ML Feature Iterations via Effective Backfill
How Pinterest Accelerates ML Feature Iterations via Effective Backfill How Pinterest Accelerates ML Feature Iterations via Effective Backfill

Authors: Kartik Kapur, Tech Lead, Sr Software Engineer | Matthew Jin, Sr Software Engineer | Qingxian Lai, Staff Software EngineerContextAt Pinterest, our mission is to inspire users to curate a life they love. To achieve this, we rely on state-of-the-art Recommendation and Ads models trained on tens of petabytes of data over the span of many months of engagement logs. These models drive personalized recommendations, showing users content that resonates with their interests. These models show significantly better performance when trained on large datasets with events spanning over many months of events.Our ML Models are trained on a wide range of features, including Pin, user, advertiser-le…

1 month назад @ medium.com
500X Scalability of Experiment Metric Computing with Unified Dynamic Framework
500X Scalability of Experiment Metric Computing with Unified Dynamic Framework 500X Scalability of Experiment Metric Computing with Unified Dynamic Framework

Xinyue Cao | Software Engineer Tech Lead; Bojun Lin | Software EngineerOverviewExperimentation is a cornerstone of data-driven decision making at Pinterest. Every day, thousands of experiments run on our platform, generating insights that drive product decisions and business strategies. By the end of 2024, over 1,500 metrics — created by experiment users — are computed daily on our Experimentation Platform to meet diverse analytical needs.But as the scale of experimentation grew, so did the challenges. Delays in upstream data ingestion, difficulties in backfilling skipped metrics, and frequent scalability issues began to hinder our ability to deliver timely and reliable results.Enter the Un…

1 month, 1 week назад @ medium.com
Multi-gate-Mixture-of-Experts (MMoE) model architecture and knowledge distillation in Ads…
Multi-gate-Mixture-of-Experts (MMoE) model architecture and knowledge distillation in Ads… Multi-gate-Mixture-of-Experts (MMoE) model architecture and knowledge distillation in Ads…

Multi-gate-Mixture-of-Experts (MMoE) model architecture and knowledge distillation in Ads Engagement modeling developmentAuthors: Jiacheng Li | Machine Learning Engineer II, Ads Ranking; Matt Meng | Staff Machine Learning Engineer, Ads Ranking; Kungang Li | Principal Machine Learning Engineer, Ads Performance; Qifei Shen | Senior Staff Machine Learning Engineer, Ads RankingIntroductionMulti-gate Mixture-of-Experts (MMoE)[1,2] is a recent industry-proven powerful architecture in neural network models that offers several significant benefits. First, it enhances model efficiency by dynamically allocating computational resources to different sub-networks (experts) based on the input data, ensur…

1 month, 4 weeks назад @ medium.com
Migrating 3.7 Million Lines of Flow Code to TypeScript
Migrating 3.7 Million Lines of Flow Code to TypeScript Migrating 3.7 Million Lines of Flow Code to TypeScript

Authors: Jack Hsu | Staff Software Engineer, Core Web Platform; Mark Molinaro | Staff Software Engineer, Code and Language RuntimePinterest migrated 3.7 million lines of code from Flow to TypeScript in eight months, leading to better type safety, developer experience, and improved hiring. Along the way, we learned a lot and greatly benefited from the open source community, and it’s our turn to give back. Today, we’re excited to share our learnings and contributions to Stripe’s flow-to-typescript codemod!Why?In 2016, Pinterest began adding types to our JavaScript codebase. At that time, we chose Flow over TypeScript for several reasons:Gradual Adoption: Flow allowed for easier incremental ad…

2 months, 1 week назад @ medium.com
Improving Pinterest Search Relevance Using Large Language Models
Improving Pinterest Search Relevance Using Large Language Models Improving Pinterest Search Relevance Using Large Language Models

Han Wang | Machine Learning Engineer II, Relevance & Query Understanding; Mukuntha Narayanan | Machine Learning Engineer II, Relevance & Query Understanding; Onur Gungor | (former) Staff Machine Learning Engineer, Relevance & Query Understanding; Jinfeng Rao | Senior Staff Machine Learning Engineer, Pinner DiscoveryFigure: Illustration of the search relevance system at Pinterest.BackgroundPinterest Search is one of the key surfaces on Pinterest where users can discover inspiring content that aligns with their information needs. Search relevance measures how well the search results aligned with the search query. Using a relevance objective allows the search engine to ensure that the content …

2 months, 2 weeks назад @ medium.com
Building Holiday Finds: How Pinterest Engineers Reimagined Gift Discovery
Building Holiday Finds: How Pinterest Engineers Reimagined Gift Discovery Building Holiday Finds: How Pinterest Engineers Reimagined Gift Discovery

Megan Blake, Usha Amrutha Nookala, Jeremy Browning, Sarah Tao, AJ Oxendine, Siddarth MalreddyOverview & ContextThe holiday shopping season presents a unique challenge: helping millions of Pinners discover and save perfect gifts across a vast sea of possibilities. While Pinterest has always been a destination for gift inspiration, our data showed that users were facing two key friction points: discovery overwhelm and fragmented wishlists. With 85% of weekly US Pinners having made a purchase based on Pins from brands¹, we saw an opportunity to create a more streamlined gift discovery experience that meets Pinners where they already are — at the early stages of shopping inspiration.The Challen…

2 months, 4 weeks назад @ medium.com
Module Relevance on Homefeed
Module Relevance on Homefeed Module Relevance on Homefeed

Usha Amrutha Nookala, Jason Madeano, Siddarth Malreddy, Lucy Song, Alekhya PIn the past, Homefeed on Pinterest recommended a grid of Pins that are most relevant to a user. The grid limits our ability to provide more context on the recommendations as well as show new topics the user might be interested in. To address this, we introduced modules to the Homefeed. We developed several components to ensure that the user’s Homefeed remains relevant with this new content type. This blog post details these components. The figure below provides an overview of our system and demonstrates how it interacts with the existing main feed of Pins.Figure 1: Overview of the module relevance backendModulesModu…

3 months назад @ medium.com
Infrastructure Advancements at AWS ReInvent 2024
Infrastructure Advancements at AWS ReInvent 2024 Infrastructure Advancements at AWS ReInvent 2024

Madhuri Racherla, VP, Engineering — Infra & SREAt the recent AWS ReInvent 2024 conference, Madhuri Racherla, VP of Infrastructure & SRE, shared an inspiring story of the company’s ongoing journey to optimize performance and reduce costs. Her talk not only highlighted Pinterest’s strategic infrastructure advancements but also aimed to motivate engineers to pursue innovation and excellence.A Vision of Boundless CreativityMadhuri kicked off her presentation by painting a picture of a world where creativity knows no bounds. With Pinterest’s mission to inspire over 553 million monthly active users* to create lives they love, the platform isn’t just a hub for ideas; it’s a movement celebrating cr…

4 months назад @ medium.com
The Quest to Understand Metric Movements
The Quest to Understand Metric Movements The Quest to Understand Metric Movements

Charles Wu, Software Engineer | Isabel Tallam, Software Engineer | Franklin Shiao, Software Engineer | Kapil Bajaj, Engineering ManagerOverviewSuppose you just saw an interesting rise or drop in one of your key metrics. Why did that happen? It’s an easy question to ask, but much harder to answer.One of the key difficulties in finding root causes for metric movements is that these causes can come in all shapes and sizes. For example, if your metric dashboard shows users experiencing higher latency as they scroll through their home feed, then that could be caused by anything from an OS upgrade, a logging or data pipeline error, an unusually large increase in user traffic, a code change landed…

4 months, 1 week назад @ medium.com
Facebook
последний пост 1 month, 2 weeks назад
Accelerating GPU indexes in Faiss with NVIDIA cuVS
Accelerating GPU indexes in Faiss with NVIDIA cuVS

Meta and NVIDIA collaborated to accelerate vector search on GPUs by integrating NVIDIA cuVS into Faiss v1.10, Meta’s open source library for similarity search. This new implementation of cuVS will be more performant than classic GPU-accelerated search in some areas. For inverted file (IVF) indexing, NVIDIA cuVS outperforms classical GPU-accelerated IVF build times by up [...]

Read More...

The post Accelerating GPU indexes in Faiss with NVIDIA cuVS appeared first on Engineering at Meta.

1 month, 2 weeks назад @ engineering.fb.com
Introducing AutoPatchBench: A Benchmark for AI-Powered Security Fixes
Introducing AutoPatchBench: A Benchmark for AI-Powered Security Fixes

We are introducing AutoPatchBench, a benchmark for the automated repair of vulnerabilities identified through fuzzing. By providing a standardized benchmark, AutoPatchBench enables researchers and practitioners to objectively evaluate and compare the effectiveness of various AI program repair systems. This initiative facilitates the development of more robust security solutions, and also encourages collaboration within the community [...]

Read More...

The post Introducing AutoPatchBench: A Benchmark for AI-Powered Security Fixes appeared first on Engineering at Meta.

1 month, 3 weeks назад @ engineering.fb.com
Building multimodal AI for Ray-Ban Meta glasses
Building multimodal AI for Ray-Ban Meta glasses

Multimodal AI – models capable of processing multiple different types of inputs like speech, text, and images – have been transforming user experiences in the wearables space. With our Ray-Ban Meta glasses, multimodal AI helps the glasses see what the wearer is seeing. This means anyone wearing Ray-Ban Meta glasses can ask them questions about [...]

Read More...

The post Building multimodal AI for Ray-Ban Meta glasses appeared first on Engineering at Meta.

3 months, 2 weeks назад @ engineering.fb.com
Revolutionizing software testing: Introducing LLM-powered bug catchers
Revolutionizing software testing: Introducing LLM-powered bug catchers

WHAT IT IS Meta’s Automated Compliance Hardening (ACH) tool is a system for mutation-guided, LLM-based test generation. ACH hardens platforms against regressions by generating undetected faults (mutants) in source code that are specific to a given area of concern and using those same mutants to generate tests. When applied to privacy, for example, ACH automates [...]

Read More...

The post Revolutionizing software testing: Introducing LLM-powered bug catchers appeared first on Engineering at Meta.

4 months, 2 weeks назад @ engineering.fb.com
Meta Andromeda: Supercharging Advantage+ automation with the next-gen personalized ads retrieval engine
Meta Andromeda: Supercharging Advantage+ automation with the next-gen personalized ads retrieval engine

Andromeda is Meta’s proprietary machine learning (ML) system design for retrieval in ad recommendation focused on delivering a step-function improvement in value to our advertisers and people. This system pushes the boundary of cutting edge AI for retrieval with NVIDIA Grace Hopper Superchip and Meta Training and Inference Accelerator (MTIA) hardware through innovations in ML [...]

Read More...

The post Meta Andromeda: Supercharging Advantage+ automation with the next-gen personalized ads retrieval engine appeared first on Engineering at Meta.

6 months, 3 weeks назад @ engineering.fb.com
Sequence learning: A paradigm shift for personalized ads recommendations
Sequence learning: A paradigm shift for personalized ads recommendations

AI plays a fundamental role in creating valuable connections between people and advertisers within Meta’s family of apps. Meta’s ad recommendation engine, powered by deep learning recommendation models (DLRMs), has been instrumental in delivering personalized ads to people. Key to this success was incorporating thousands of human-engineered signals or features in the DLRM-based recommendation system. [...]

Read More...

The post Sequence learning: A paradigm shift for personalized ads recommendations appeared first on Engineering at Meta.

7 months назад @ engineering.fb.com
OCP Summit 2024: The open future of networking hardware for AI
OCP Summit 2024: The open future of networking hardware for AI

At Open Compute Project Summit (OCP) 2024, we’re sharing details about our next-generation network fabric for our AI training clusters. We’ve expanded our network hardware portfolio and are contributing two new disaggregated network fabrics and a new NIC to OCP. We look forward to continued collaboration with OCP to open designs for racks, servers, storage [...]

Read More...

The post OCP Summit 2024: The open future of networking hardware for AI appeared first on Engineering at Meta.

8 months, 1 week назад @ engineering.fb.com
Meta’s open AI hardware vision
Meta’s open AI hardware vision

At the Open Compute Project (OCP) Global Summit 2024, we’re showcasing our latest open AI hardware designs with the OCP community. These innovations include a new AI platform, cutting-edge open rack designs, and advanced network fabrics and components. By sharing our designs, we hope to inspire collaboration and foster innovation. If you’re passionate about building [...]

Read More...

The post Meta’s open AI hardware vision appeared first on Engineering at Meta.

8 months, 1 week назад @ engineering.fb.com
How open source AI can improve population estimates, sustainable energy, and the delivery of climate change interventions
How open source AI can improve population estimates, sustainable energy, and the delivery of climate change interventions

Data for Good at Meta is open-sourcing the data used to train our AI-powered population maps. We’re hoping that researchers and other organizations around the world will be able to leverage these tools to assist with a wide range of projects including those on climate adaptation, public health and disaster response. The dataset and code [...]

Read More...

The post How open source AI can improve population estimates, sustainable energy, and the delivery of climate change interventions appeared first on Engineering at Meta.

8 months, 3 weeks назад @ engineering.fb.com
Simulator-based reinforcement learning for data center cooling optimization
Simulator-based reinforcement learning for data center cooling optimization

We’re sharing more about the role that reinforcement learning plays in helping us optimize our data centers’ environmental controls. Our reinforcement learning-based approach has helped us reduce energy consumption and water usage across various weather conditions. Meta is revamping its new data center design to optimize for artificial intelligence and the same methodology will be [...]

Read More...

The post Simulator-based reinforcement learning for data center cooling optimization appeared first on Engineering at Meta.

9 months, 2 weeks назад @ engineering.fb.com
Uber Engineering
последний пост None
Spotify Engineering Spotify Engineering
последний пост 1 month, 2 weeks назад
Incident Report: Spotify Outage on April 16, 2025
Incident Report: Spotify Outage on April 16, 2025

On April 16, Spotify experienced an outage that affected users [...]

The post Incident Report: Spotify Outage on April 16, 2025 appeared first on Spotify Engineering.

1 month, 2 weeks назад @ engineering.atspotify.com
Celebrating Five Years of Backstage: From Open Source Project to Enterprise Software Business
Celebrating Five Years of Backstage: From Open Source Project to Enterprise Software Business

Did you know that we sell Spotify’s developer productivity tools [...]

The post Celebrating Five Years of Backstage: From Open Source Project to Enterprise Software Business appeared first on Spotify Engineering.

2 months назад @ engineering.atspotify.com
A Behind-the-Scenes Look at How We Release the Spotify App (Part 1)
A Behind-the-Scenes Look at How We Release the Spotify App (Part 1)

Developing and releasing mobile apps at scale is a big [...]

The post A Behind-the-Scenes Look at How We Release the Spotify App (Part 1) appeared first on Spotify Engineering.

2 months назад @ engineering.atspotify.com
An Insider’s Tips for Taking the Certified Backstage Associate (CBA) Exam
An Insider’s Tips for Taking the Certified Backstage Associate (CBA) Exam

TL;DR There’s a brand new engineering certification in town: Certified [...]

The post An Insider’s Tips for Taking the Certified Backstage Associate (CBA) Exam appeared first on Spotify Engineering.

2 months, 4 weeks назад @ engineering.atspotify.com
Building Confidence: A Case Study in How to Create Confidence Scores for GenAI Applications
Building Confidence: A Case Study in How to Create Confidence Scores for GenAI Applications

TL;DR Getting a response from GenAI is quick and straightforward. But what about the confidence level for that response? In [...]

The post Building Confidence: A Case Study in How to Create Confidence Scores for GenAI Applications appeared first on Spotify Engineering.

6 months, 1 week назад @ engineering.atspotify.com
Congratulations to the Recipients of the 2024 Spotify FOSS Fund
Congratulations to the Recipients of the 2024 Spotify FOSS Fund

TL;DR The Spotify FOSS Fund is back again! We created the Spotify FOSS Fund in 2022 to help support the [...]

The post Congratulations to the Recipients of the 2024 Spotify FOSS Fund appeared first on Spotify Engineering.

6 months, 4 weeks назад @ engineering.atspotify.com
How We Generated Millions of Content Annotations
How We Generated Millions of Content Annotations

With the fields of machine learning (ML) and generative AI (GenAI) continuing to rapidly evolve and expand, it has become [...]

The post How We Generated Millions of Content Annotations appeared first on Spotify Engineering.

8 months назад @ engineering.atspotify.com
Are You a Dalia? How We Created Data Science Personas for Spotify’s Analytics Platform
Are You a Dalia? How We Created Data Science Personas for Spotify’s Analytics Platform

On Spotify’s Analytics Platform, we’re dedicated to building products that empower data practitioners to discover, analyze, and share insights — [...]

The post Are You a Dalia? How We Created Data Science Personas for Spotify’s Analytics Platform appeared first on Spotify Engineering.

9 months, 2 weeks назад @ engineering.atspotify.com
Unlocking Insights with High-Quality Dashboards at Scale
Unlocking Insights with High-Quality Dashboards at Scale

We have a lot of dashboards at Spotify. Our Insight teams and analysts from across the company are constantly whipping [...]

The post Unlocking Insights with High-Quality Dashboards at Scale appeared first on Spotify Engineering.

9 months, 4 weeks назад @ engineering.atspotify.com
Ripple Engineering Ripple Engineering
последний пост None
Dmitry Anoshin recommends
Snowflake
последний пост None
Smart Data
последний пост 7 часов назад
What the Rise of AI Web Scrapers Means for Data Teams
What the Rise of AI Web Scrapers Means for Data Teams

AI is becoming essential for managing, cleaning, and analyzing the massive flow of business data.

7 часов назад @ smartdatacollective.com
Free AI Tools to Test Website Accessibility
Free AI Tools to Test Website Accessibility

AI is changing how websites work, from design tweaks to smarter user interactions.

5 days, 7 hours назад @ smartdatacollective.com
Thinking Machines At Work: How Generative AI Models Are Redefining Business Intelligence
Thinking Machines At Work: How Generative AI Models Are Redefining Business Intelligence

From data patterns to boardroom strategy - how generative AI is becoming the ultimate business co-pilot, redefining what's possible in analytics.

6 days, 5 hours назад @ smartdatacollective.com
The Power of AI for Personalization in Email
The Power of AI for Personalization in Email

AI tools help tailor emails to each person, boosting engagement without the extra workload.

2 weeks, 2 days назад @ smartdatacollective.com
Improving LinkedIn Ad Strategies with Data Analytics
Improving LinkedIn Ad Strategies with Data Analytics

Data helps marketers reach the right audience and spend ad budgets more wisely on LinkedIn.

2 weeks, 6 days назад @ smartdatacollective.com
Data Helps Speech-Language Pathologists Deliver Better Results
Data Helps Speech-Language Pathologists Deliver Better Results

Data helps speech-language pathologists make more precise, informed, and effective decisions for their clients.

2 weeks, 6 days назад @ smartdatacollective.com
AI Helps Businesses Develop Better Marketing Strategies
AI Helps Businesses Develop Better Marketing Strategies

More marketers are turning to AI tools to keep up with fast deadlines and changing audience needs.

1 month назад @ smartdatacollective.com
Agenic AI is Paying Huge Dividends for Companies Trying to Improve Decision-Making
Agenic AI is Paying Huge Dividends for Companies Trying to Improve Decision-Making

We have talked a lot about some of the benefits of using AI to run a business. There is no wonder that companies around the world are expected to spend over $244 billion on AI by the end of this year. One of the biggest reasons companies are using AI is to improve their decision-making, […]

1 month назад @ smartdatacollective.com
Forensic AI Technology is Doing Wonders for Law Enforcement
Forensic AI Technology is Doing Wonders for Law Enforcement

New tools are helping law enforcement process complex evidence faster and revisit unsolved cases with fresh eyes.

1 month, 1 week назад @ smartdatacollective.com
LangGraph Orchestrator Agents: Streamlining AI Workflow Automation
LangGraph Orchestrator Agents: Streamlining AI Workflow Automation

Transform your AI processes with LangGraph Orchestrator Agents! Streamline workflows and boost efficiency like never before. #AIAutomation

1 month, 1 week назад @ smartdatacollective.com
Will AI Replace Personal Trainers? A Data-Driven Look at the Future of Fitness Careers
Will AI Replace Personal Trainers? A Data-Driven Look at the Future of Fitness Careers

There are a number of huge ways that AI technology is helping with fitness.

1 month, 1 week назад @ smartdatacollective.com
How Data-Driven Insights Are Addressing Gaps in Patient Communication and Equity
How Data-Driven Insights Are Addressing Gaps in Patient Communication and Equity

Unfortunately, we don’t all experience the healthcare system the same way. While the vast majority of patients in the United States have complaints regarding their healthcare options, the actual experiences vary significantly—based largely on cultural or economic grounds. Better data has improved our ability to understand who is being let down by healthcare—and what to […]

1 month, 3 weeks назад @ smartdatacollective.com
Data Analytics Is Revolutionizing Medical Credentialing
Data Analytics Is Revolutionizing Medical Credentialing

Advanced data tools are improving how medical credentials are verified to better protect patient safety.

2 months, 1 week назад @ smartdatacollective.com
AI Tools Reshape Social Media for Lawyers
AI Tools Reshape Social Media for Lawyers

Law firms are using AI to boost efficiency, improve accuracy, and drive new revenue opportunities with social media.

2 months, 1 week назад @ smartdatacollective.com
AI in Healthcare: How Smart Technologies Revolutionize Patient Experience
AI in Healthcare: How Smart Technologies Revolutionize Patient Experience

Discover how AI is reshaping healthcare by enhancing patient care, streamlining processes, and saving lives.

2 months, 2 weeks назад @ smartdatacollective.com
Knoldus
последний пост None
We Cloud Data We Cloud Data
последний пост 5 days, 10 hours назад
Enhancing Everyday Healthcare with Machine Learning: Early Disease Detection
Enhancing Everyday Healthcare with Machine Learning: Early Disease Detection

Revolutionize healthcare with machine learning for early disease detection. Explore cutting-edge solutions improving everyday health, ensuring timely interventions for a healthier future. #HealthTech #MachineLearning #DiseaseDetection

The post Enhancing Everyday Healthcare with Machine Learning: Early Disease Detection appeared first on WeCloudData.

5 days, 10 hours назад @ weclouddata.com
Consulting Case Study: E-commerce Customer Segmentation
Consulting Case Study: E-commerce Customer Segmentation

Background Our client is a company manufacturing consumer electronic products like mobile devices, printers, computer monitors and so on, who is leading the electronic goods merchant wholesalers industry for many years. Their advanced data analytics team connected to WeCloudData for the machine learning solution on predicting their top merchandize sales and marketing strategies on their […]

The post Consulting Case Study: E-commerce Customer Segmentation appeared first on WeCloudData.

6 days, 10 hours назад @ weclouddata.com
Build Your First Chatbot Using Python-NLTK
Build Your First Chatbot Using Python-NLTK

Chatbots have revolutionized the way we engage with technology. Their effect is extensive, ranging from providing customer service to serving as personal assistants. If you’re looking to start building a chatbot in python using nltk, you’re in the right place. In this tutorial, we’ll guide you through creating a basic Python chatbot from scratch using […]

The post Build Your First Chatbot Using Python-NLTK appeared first on WeCloudData.

1 week, 3 days назад @ weclouddata.com
Top Essential Python Libraries for Data Science in 2025
Top Essential Python Libraries for Data Science in 2025

Python’s ease of use, adaptability, and constantly expanding toolkit have made it the foundation of modern data research. In 2025, this programming language continues to dominate the market due to its multiple essential libraries, which cover everything from data manipulation to machine learning, system operations, and web communication. Using the right Python libraries can help […]

The post Top Essential Python Libraries for Data Science in 2025 appeared first on WeCloudData.

1 week, 4 days назад @ weclouddata.com
From Data to Decisions: Market Basket Analysis for Retailers Using Python
From Data to Decisions: Market Basket Analysis for Retailers Using Python

In today’s data-driven world, understanding customer purchasing behavior plays a crucial role for businesses aiming to enhance sales and customer satisfaction. Market Basket Analysis is a powerful technique that helps in discovering associations between products purchased together, enabling retailers to make informed decisions on product placements, promotions, and recommendations. Market basket analysis is a great […]

The post From Data to Decisions: Market Basket Analysis for Retailers Using Python appeared first on WeCloudData.

1 week, 5 days назад @ weclouddata.com
Online Shopping Redefined: Predicting Shopper Behavior with Machine Learning
Online Shopping Redefined: Predicting Shopper Behavior with Machine Learning

Online Shopping Redefined: Predicting Shopper Behavior with Machine Learning

The post Online Shopping Redefined: Predicting Shopper Behavior with Machine Learning appeared first on WeCloudData.

1 week, 6 days назад @ weclouddata.com
Natural Language Processing in Healthcare
Natural Language Processing in Healthcare

Natural Language Processing (NLP) is the key to all the recent advancements in Generative AI. Like many other industries, NLP has also revolutionized the life sciences and healthcare. The application of NLP in the medical domain ranges from drug discovery and efficient diagnosis to patient care and automating administrative tasks. To learn more about how […]

The post Natural Language Processing in Healthcare appeared first on WeCloudData.

2 weeks, 3 days назад @ weclouddata.com
Building a Book Recommendation System Using Python
Building a Book Recommendation System Using Python

At WeCloudData, we empower learners to bridge the gap between theory and real-world data science skills. In this blog, we’ll explore how to build a book recommendation system using python, a practical application of machine learning that not only enhances your coding proficiency but also strengthens your data science portfolio. This blog is designed for […]

The post Building a Book Recommendation System Using Python appeared first on WeCloudData.

3 weeks, 3 days назад @ weclouddata.com
From First Hug to First Model: Getting Started with Transformers on Hugging Face
From First Hug to First Model: Getting Started with Transformers on Hugging Face

Welcome back! In our previous blog, “From Zero to 🤗: Your First Hug with Hugging Face,” we introduced the Hugging Face ecosystem and its user-friendly tools for exploring AI models. Now, let’s take the next step and enter the world of Transformers. Hugging face Transformers are powerful models used for many natural language processing (NLP) […]

The post From First Hug to First Model: Getting Started with Transformers on Hugging Face appeared first on WeCloudData.

3 weeks, 4 days назад @ weclouddata.com
Best Open-Source Text to Speech Models
Best Open-Source Text to Speech Models

How do you start your day? For me, it starts with asking my digital assistant, Siri, to read news or the weather forecast while I prepare breakfast. Sometimes I ask ChatGPT for breakfast recipes. Text-to-speech and speech-to-text technologies power these everyday conveniences. AI has become deeply integrated into our daily lives, and understanding and utilizing […]

The post Best Open-Source Text to Speech Models appeared first on WeCloudData.

3 weeks, 4 days назад @ weclouddata.com
Intro to Docker
Intro to Docker

Fast deployment, scalable systems, and reproducibility are more important than ever in the fast-paced world of software, data science, machine learning (ML), and DevOps. This is where Docker shines. It helps developers build, share, run, and verify applications anywhere, without tedious environment configuration or management. This blog gives you a beginner-friendly intro to Docker, including […]

The post Intro to Docker appeared first on WeCloudData.

1 month назад @ weclouddata.com
From Zero to : Your First Hug with Hugging Face.
From Zero to : Your First Hug with Hugging Face.

The phrase “Hugging Face” is probably familiar to you, whether you’re a developer, student, digital designer, or someone curious about the magic behind AI. Maybe you thought it was a cute emoji 🤗 (it is). The founders of Hugging Face chose this emoji to symbolize their mission of making AI more approachable and friendly. It […]

The post From Zero to : Your First Hug with Hugging Face. appeared first on WeCloudData.

1 month назад @ weclouddata.com
Cloud Migration
Cloud Migration

In today’s driven world, cloud computing is not just a technological trend; it’s a business necessity. From startups to Fortune 500 companies, organizations are shifting their digital assets to the cloud to enhance agility, scalability, performance, and cost-efficiency. The shift from on-premise to cloud is known as cloud migration. It reshapes how enterprises operate in […]

The post Cloud Migration appeared first on WeCloudData.

1 month назад @ weclouddata.com
Chain of Draft Prompting (COD): The Next Step in Efficient LLM Reasoning
Chain of Draft Prompting (COD): The Next Step in Efficient LLM Reasoning

Prompt engineering is one of the most powerful tools for getting the best results from large language models (LLMS). Good prompts generate desirable outcomes from Generative AI models. There are multiple prompt engineering techniques to use. One of the most well-known techniques is Chain of Thought (CoT) prompting, where the model is instructed to break […]

The post Chain of Draft Prompting (COD): The Next Step in Efficient LLM Reasoning appeared first on WeCloudData.

1 month, 1 week назад @ weclouddata.com
Neural Networks: The Brain Behind Modern Tech
Neural Networks: The Brain Behind Modern Tech

From diagnosing diseases, powering self-driving cars, writing poems, and making stock predictions, neural networks are everywhere. But what exactly are they? How do they work? And why are they reshaping the future of technology as we know it? Let’s explore the fantastic world of neural networks with WeCloudData. In this blog, you’ll learn how these […]

The post Neural Networks: The Brain Behind Modern Tech appeared first on WeCloudData.

1 month, 1 week назад @ weclouddata.com
Learn Data Engineering
последний пост None
SCRIBD
последний пост 3 months, 1 week назад
Terraform module to manage Oxbow Lambda and its components
Terraform module to manage Oxbow Lambda and its components

Oxbow is a project to take an existing storage location which contains Apache Parquet files into a Delta Lake table.

It is intended to run both as an AWS Lambda or as a command line application.

We are excited to introduce terraform-oxbow, an open-source Terraform module that simplifies the deployment and management of AWS Lambda and its supporting components. Whether you’re working with AWS Glue, Kinesis Data Firehose, SQS, or DynamoDB, this module provides a streamlined approach to infrastructure as code (IaC) in AWS.

✨ Why terraform-oxbow?

Managing event-driven architectures in AWS can be complex, requiring careful orchestration of multiple services. Terraform-oxbow abstracts much of thi…

3 months, 1 week назад @ tech.scribd.com
Cloud-native Data Ingestion with AWS Aurora and Delta Lake
Cloud-native Data Ingestion with AWS Aurora and Delta Lake

One of the major themes for Infrastructure Engineering over the past couple

years has been higher reliability and better operational efficiency. In a

recent session with the Delta Lake project I was able to

share the work led Kuntal Basu and a number of other people to dramatically

improve the efficiency and reliability of our online data ingestion pipeline. Join Kuntal Basu, Staff Infrastructure Engineer, and R. Tyler Croy, Principal

Engineer at Scribd, Inc. as they take you behind the scenes of Scribd’s data

ingestion setup. They’ll break down the architecture, explain the tools, and

walk you through how they turned off-the-shelf solutions into a robust

pipeline. Video Presentation

5 months, 1 week назад @ tech.scribd.com
Jesse Anderson Jesse Anderson
последний пост 1 month, 1 week назад
Unapologetically Technical Episode 20 – Shane Murray
Unapologetically Technical Episode 20 – Shane Murray 1 month, 1 week назад @ jesse-anderson.com
Unapologetically Technical Episode 19 – Jacopo Tagliabue
Unapologetically Technical Episode 19 – Jacopo Tagliabue 2 months, 1 week назад @ jesse-anderson.com
Unapologetically Technical Episode 18 – Adrian Woodhead
Unapologetically Technical Episode 18 – Adrian Woodhead 3 months назад @ jesse-anderson.com
Unapologetically Technical Episode 17 – Semih Salihoglu
Unapologetically Technical Episode 17 – Semih Salihoglu 4 months, 1 week назад @ jesse-anderson.com
Unapologetically Technical Episode 16 – David Jayatillake
Unapologetically Technical Episode 16 – David Jayatillake 5 months, 1 week назад @ jesse-anderson.com
Unapologetically Technical Episode 15 – Frances Perry
Unapologetically Technical Episode 15 – Frances Perry 5 months, 4 weeks назад @ jesse-anderson.com
Unapologetically Technical Episode 14 – Cliff Crosland
Unapologetically Technical Episode 14 – Cliff Crosland

https://youtu.be/Riy8860hHSo Unapologetically Technical’s newest episode is now live! In this episode of Unapologetically Technical, I interview Cliff Crosland, the co-founder and CEO of Scanner.dev. Cliff Crosland is a data engineer passionate about helping people wrangle massive log volumes. He sees logs as a treasure trove of insights and believes effective log analysis is critical in […]

The post Unapologetically Technical Episode 14 – Cliff Crosland first appeared on Jesse Anderson.

7 months, 3 weeks назад @ jesse-anderson.com
Data Teams Survey 2020-2024 Analysis
Data Teams Survey 2020-2024 Analysis 9 months, 1 week назад @ jesse-anderson.com
Data Teams Survey 2024 Results
Data Teams Survey 2024 Results 9 months, 4 weeks назад @ jesse-anderson.com
Data Quest
последний пост None
Infrastructure
AWS
последний пост 2 days, 6 hours назад
Stream data from Amazon MSK to Apache Iceberg tables in Amazon S3 and Amazon S3 Tables using Amazon Data Firehose
Stream data from Amazon MSK to Apache Iceberg tables in Amazon S3 and Amazon S3 Tables using Amazon Data Firehose

In this post, we walk through two solutions that demonstrate how to stream data from your Amazon MSK provisioned cluster to Iceberg-based data lakes in Amazon S3 using Amazon Data Firehose.

2 days, 6 hours назад @ aws.amazon.com
Implement a rollback strategy for Amazon Aurora PostgreSQL upgrades using Amazon RDS Blue/Green deployments
Implement a rollback strategy for Amazon Aurora PostgreSQL upgrades using Amazon RDS Blue/Green deployments

Amazon Aurora PostgreSQL-Compatible Edition supports managed blue/green deployments to help reduce downtime and minimize risk during updates. Even with thorough planning and testing in non-production environments, unexpected issues can emerge after a version upgrade. In these cases, having a rollback plan is essential to quickly restore service stability. While the managed Blue/Green deployment feature doesn’t currently include built-in rollback functionality, you can implement alternative solutions for version management. In this post, we show how you can manually set up a rollback cluster using self-managed logical replication to maintain synchronization with the newer version after an Am…

2 days, 7 hours назад @ aws.amazon.com
Streamline Operational Troubleshooting with Amazon Q Developer CLI
Streamline Operational Troubleshooting with Amazon Q Developer CLI

Amazon Q Developer is the most capable generative AI–powered assistant for software development, helping developers perform complex workflows. Amazon Q Developer command-line interface (CLI) combines conversational AI with direct access to AWS services, helping you understand, build, and operate applications more effectively. The Amazon Q Developer CLI executes commands, analyzes outputs, and provides contextual recommendations […]

3 days, 6 hours назад @ aws.amazon.com
Announcing the new AWS CDK EKS v2 L2 Constructs
Announcing the new AWS CDK EKS v2 L2 Constructs

Introduction Today, we’re announcing the release of aws-eks-v2 construct, a new alpha version of AWS Cloud Development Kit (CDK) L2 construct for Amazon Elastic Kubernetes Service (EKS). This construct represents a significant change in how developers can define and manage their EKS environments using infrastructure as code. While maintaining the powerful capabilities of its predecessor […]

3 days, 7 hours назад @ aws.amazon.com
Accelerate development with secure access to Amazon Q Developer using PingIdentity
Accelerate development with secure access to Amazon Q Developer using PingIdentity

Overview Customers adopting Amazon Q Developer, a generative AI-powered coding companion, often need authentication through existing identity providers like PingIdentity. By leveraging AWS IAM Identity Center, organizations can enable their developers to access Amazon Q Developer with their existing PingIdentity credentials, streamlining authentication and removing the need for separate login procedures. Amazon Q Developer can […]

3 days, 7 hours назад @ aws.amazon.com
How an AWS customer in the learning services industry migrated and modernized SAP ASE to Amazon Aurora PostgreSQL
How an AWS customer in the learning services industry migrated and modernized SAP ASE to Amazon Aurora PostgreSQL

In this post, we explore how a leading AWS customer in the learning services industry successfully modernized its legacy SAP ASE environment by migrating to Amazon Aurora PostgreSQL-Compatible Edition. Partnering with AWS, the customer engineered a comprehensive migration strategy to transition from a proprietary system to an open source database while providing high availability, performance optimization, and cost-efficiency.

3 days, 7 hours назад @ aws.amazon.com
Secure access to a cross-account Amazon MSK cluster from Amazon MSK Connect using IAM authentication
Secure access to a cross-account Amazon MSK cluster from Amazon MSK Connect using IAM authentication

In this post, we demonstrate a use case where you might need to use an MSK cluster in one AWS account, but MSK Connect is located in a separate account. We demonstrate how to implement IAM authentication after establishing network connectivity. IAM provides enhanced security measures, making sure your systems are protected against unauthorized access.

3 days, 7 hours назад @ aws.amazon.com
Build a multi-Region analytics solution with Amazon Redshift, Amazon S3, and Amazon QuickSight
Build a multi-Region analytics solution with Amazon Redshift, Amazon S3, and Amazon QuickSight

This post explores how to effectively architect a solution that addresses this specific challenge: enabling comprehensive analytics capabilities for global teams while making sure that your data remains in the AWS Regions required by your compliance framework. We use a variety of AWS services, including Amazon Redshift, Amazon Simple Storage Service (Amazon S3), and Amazon QuickSight.

3 days, 7 hours назад @ aws.amazon.com
Build a scalable AI video generator using Amazon SageMaker AI and CogVideoX
Build a scalable AI video generator using Amazon SageMaker AI and CogVideoX

In recent years, the rapid advancement of artificial intelligence and machine learning (AI/ML) technologies has revolutionized various aspects of digital content creation. One particularly exciting development is the emergence of video generation capabilities, which offer unprecedented opportunities for companies across diverse industries. This technology allows for the creation of short video clips that can be […]

3 days, 8 hours назад @ aws.amazon.com
Building trust in AI: The AWS approach to the EU AI Act
Building trust in AI: The AWS approach to the EU AI Act

The EU AI Act establishes comprehensive regulations for AI development and deployment within the EU. AWS is committed to building trust in AI through various initiatives including being among the first signatories of the EU's AI Pact, providing AI Service Cards and guardrails, and offering educational resources while helping customers understand their responsibilities under the new regulatory framework.

3 days, 8 hours назад @ aws.amazon.com
Update on the AWS DeepRacer Student Portal
Update on the AWS DeepRacer Student Portal

Starting July 14, 2025, the AWS DeepRacer Student Portal will enter a maintenance phase where new registrations will be disabled. Until September 15, 2025, existing users will retain full access to their content and training materials, with updates limited to critical security fixes, after which the portal will no longer be available.

3 days, 8 hours назад @ aws.amazon.com
Accelerate foundation model training and inference with Amazon SageMaker HyperPod and Amazon SageMaker Studio
Accelerate foundation model training and inference with Amazon SageMaker HyperPod and Amazon SageMaker Studio

In this post, we discuss how SageMaker HyperPod and SageMaker Studio can improve and speed up the development experience of data scientists by using IDEs and tooling of SageMaker Studio and the scalability and resiliency of SageMaker HyperPod with Amazon EKS. The solution simplifies the setup for the system administrator of the centralized system by using the governance and security capabilities offered by the AWS services.

3 days, 8 hours назад @ aws.amazon.com
RocksDB 101: Optimizing stateful streaming in Apache Spark with Amazon EMR and AWS Glue
RocksDB 101: Optimizing stateful streaming in Apache Spark with Amazon EMR and AWS Glue

This post explores RocksDB's key features and demonstrates its implementation using Spark on Amazon EMR and AWS Glue, providing you with the knowledge you need to scale your real-time data processing capabilities.

4 days, 8 hours назад @ aws.amazon.com
Meeting summarization and action item extraction with Amazon Nova
Meeting summarization and action item extraction with Amazon Nova

In this post, we present a benchmark of different understanding models from the Amazon Nova family available on Amazon Bedrock, to provide insights on how you can choose the best model for a meeting summarization task.

4 days, 12 hours назад @ aws.amazon.com
Building a custom text-to-SQL agent using Amazon Bedrock and Converse API
Building a custom text-to-SQL agent using Amazon Bedrock and Converse API

Developing robust text-to-SQL capabilities is a critical challenge in the field of natural language processing (NLP) and database management. The complexity of NLP and database management increases in this field, particularly while dealing with complex queries and database structures. In this post, we introduce a straightforward but powerful solution with accompanying code to text-to-SQL using a custom agent implementation along with Amazon Bedrock and Converse API.

4 days, 12 hours назад @ aws.amazon.com
AWS
последний пост 2 days, 6 hours назад
Accelerate threat modeling with generative AI
Accelerate threat modeling with generative AI

In this post, we explore how generative AI can revolutionize threat modeling practices by automating vulnerability identification, generating comprehensive attack scenarios, and providing contextual mitigation strategies.

4 days, 12 hours назад @ aws.amazon.com
Building resilient applications: design patterns for handling database outages
Building resilient applications: design patterns for handling database outages

Database outages, whether planned or unexpected, pose significant challenges to applications. Planned outages for maintenance can be scheduled but still impact users. Unplanned outages are more disruptive and can happen at critical times. Even the most robust and resilient databases will inevitably experience outages, making application resiliency a critical consideration in modern system design. In […]

5 days, 8 hours назад @ aws.amazon.com
How Anomalo solves unstructured data quality issues to deliver trusted assets for AI with AWS
How Anomalo solves unstructured data quality issues to deliver trusted assets for AI with AWS

In this post, we explore how you can use Anomalo with Amazon Web Services (AWS) AI and machine learning (AI/ML) to profile, validate, and cleanse unstructured data collections to transform your data lake into a trusted source for production ready AI initiatives.

5 days, 13 hours назад @ aws.amazon.com
An innovative financial services leader finds the right AI solution: Robinhood and Amazon Nova
An innovative financial services leader finds the right AI solution: Robinhood and Amazon Nova

In this post, we share how Robinhood delivers democratized finance and real-time market insights using generative AI and Amazon Nova.

5 days, 13 hours назад @ aws.amazon.com
Build conversational interfaces for structured data using Amazon Bedrock Knowledge Bases
Build conversational interfaces for structured data using Amazon Bedrock Knowledge Bases

This post provides instructions to configure a structured data retrieval solution, with practical code examples and templates. It covers implementation samples and additional considerations, empowering you to quickly build and scale your conversational data interfaces.

5 days, 13 hours назад @ aws.amazon.com
Native SQL Server replication options on Amazon RDS Custom for SQL Server
Native SQL Server replication options on Amazon RDS Custom for SQL Server

In this post, we explore SQL Server replication implementation on Amazon RDS Custom. You’ll learn about different replication types supported on RDS Custom SQL Server, including snapshot, transactional, and merge replication, along with their specific use cases. Finally, we provide a step-by-step guide to setting up replication, from configuring the distributor to creating publications and managing subscriptions.

6 days, 8 hours назад @ aws.amazon.com
Implement row-level security in Amazon Aurora MySQL and Amazon RDS for MySQL
Implement row-level security in Amazon Aurora MySQL and Amazon RDS for MySQL

Row-level security (RLS) is a security mechanism that enhances data protection in scalable applications by controlling access at the individual row level. It enables organizations to implement fine-grained access controls based on user attributes, so users can only view and modify data they’re authorized to access. This post focuses on implementing a cost-effective custom RLS solution using native MySQL features, making it suitable for a wide range of use cases without requiring additional software dependencies. This solution is applicable for both Amazon Relational Database Service (Amazon RDS) for MySQL and Amazon Aurora MySQL-Compatible Edition, providing flexibility for users of either …

6 days, 8 hours назад @ aws.amazon.com
Reduce time to access your transactional data for analytical processing using the power of Amazon SageMaker Lakehouse and zero-ETL
Reduce time to access your transactional data for analytical processing using the power of Amazon SageMaker Lakehouse and zero-ETL

In this post, we demonstrate how you can bring transactional data from AWS OLTP data stores like Amazon Relational Database Service (Amazon RDS) and Amazon Aurora flowing into Redshift using zero-ETL integrations to SageMaker Lakehouse Federated Catalog (Bring your own Amazon Redshift into SageMaker Lakehouse). With this integration, you can now seamlessly onboard the changed data from OLTP systems to a unified lakehouse and expose the same to analytical applications for consumptions using Apache Iceberg APIs from new SageMaker Unified Studio.

6 days, 8 hours назад @ aws.amazon.com
How Apollo Tyres is unlocking machine insights using agentic AI-powered Manufacturing Reasoner
How Apollo Tyres is unlocking machine insights using agentic AI-powered Manufacturing Reasoner

In this post, we share how Apollo Tyres used generative AI with Amazon Bedrock to harness the insights from their machine data in a natural language interaction mode to gain a comprehensive view of its manufacturing processes, enabling data-driven decision-making and optimizing operational efficiency.

6 days, 10 hours назад @ aws.amazon.com
Extend your Amazon Q Business with PagerDuty Advance data accessor
Extend your Amazon Q Business with PagerDuty Advance data accessor

In this post, we demonstrate how organizations can enhance their incident management capabilities by integrating PagerDuty Advance, an innovative set of agentic and generative AI capabilities that automate response workflows and provide real-time insights into operational health, with Amazon Q Business. We show how to configure PagerDuty Advance as a data accessor for Amazon Q indexes, so you can search and access enterprise knowledge across multiple systems during incident response.

6 days, 11 hours назад @ aws.amazon.com
Innovate business logic by implementing return of control in Amazon Bedrock Agents
Innovate business logic by implementing return of control in Amazon Bedrock Agents

In the context of distributed systems and microservices architecture, orchestrating communication between diverse components presents significant challenges. However, with the launch of Amazon Bedrock Agents, the landscape is evolving, offering a simplified approach to agent creation and seamless integration of the return of control capability. In this post, we explore how Amazon Bedrock Agents revolutionizes agent creation and demonstrates the efficacy of the return of control capability in orchestrating complex interactions between multiple systems.

6 days, 11 hours назад @ aws.amazon.com
Deploy Qwen models with Amazon Bedrock Custom Model Import
Deploy Qwen models with Amazon Bedrock Custom Model Import

You can now import custom weights for Qwen2, Qwen2_VL, and Qwen2_5_VL architectures, including models like Qwen 2, 2.5 Coder, Qwen 2.5 VL, and QwQ 32B. In this post, we cover how to deploy Qwen 2.5 models with Amazon Bedrock Custom Model Import, making them accessible to organizations looking to use state-of-the-art AI capabilities within the AWS infrastructure at an effective cost.

1 week, 2 days назад @ aws.amazon.com
Build generative AI solutions with Amazon Bedrock
Build generative AI solutions with Amazon Bedrock

In this post, we show you how to build generative AI applications on Amazon Web Services (AWS) using the capabilities of Amazon Bedrock, highlighting how Amazon Bedrock can be used at each step of your generative AI journey. This guide is valuable for both experienced AI engineers and newcomers to the generative AI space, helping you use Amazon Bedrock to its fullest potential.

1 week, 2 days назад @ aws.amazon.com
How Netsertive built a scalable AI assistant to extract meaningful insights from real-time data using Amazon Bedrock and Amazon Nova
How Netsertive built a scalable AI assistant to extract meaningful insights from real-time data using Amazon Bedrock and Amazon Nova

In this post, we show how Netsertive introduced a generative AI-powered assistant into MLX, using Amazon Bedrock and Amazon Nova, to bring their next generation of the platform to life.

1 week, 2 days назад @ aws.amazon.com
Make videos accessible with automated audio descriptions using Amazon Nova
Make videos accessible with automated audio descriptions using Amazon Nova

In this post, we demonstrate how you can use services like Amazon Nova, Amazon Rekognition, and Amazon Polly to automate the creation of accessible audio descriptions for video content. This approach can significantly reduce the time and cost required to make videos accessible for visually impaired audiences.

1 week, 2 days назад @ aws.amazon.com
Astronomer Astronomer
последний пост None
DBT — Data Build Tool DBT — Data Build Tool
последний пост None
FiveTran FiveTran
последний пост None
DataBricks
последний пост None
Mix
/r/DataEngineering
последний пост 29 минут назад
Is Kimball outdated now?
Is Kimball outdated now?

When I was first starting out, I read his 2nd edition and it was great. It's what I used for years until some of the more modern techniques started popping up. I recently was asked for resources on data modeling and recommended Kimball, but apparently this book is outdated now? Is there a better book to recommend for modern data modeling? submitted by /u/fake-bird-123 [link] [comments]

29 минут назад @ reddit.com
AI / Agentic use in pipelines
AI / Agentic use in pipelines

I recently did a focus group for a data engineering tool and during that the moderator was surprised my organization wasn’t using any AI agents within our ELT pipeline. And now I’m getting ads for Ascend’s new agentic pipeline offerings. This seems crazy to me and I’m wondering how many of y’all are actuating utilizing these tools as part of the pipeline to validate or normalize data? I feel like the AI blackbox is a ridiculous liability but maybe I’m out of touch with what’s going on in this industry. submitted by /u/poopdood696969 [link] [comments]

2 часа назад @ reddit.com
Your managed Kafka setup on GCP is incomplete. Here's why.
Your managed Kafka setup on GCP is incomplete. Here's why. Your managed Kafka setup on GCP is incomplete. Here's why.

Google Managed Service for Apache Kafka is a powerful platform, but it leaves your team operating with a massive blind spot: a lack of effective, built-in tooling for real-world operations. Without a comprehensive UI, you're missing a single pane of glass for: * Browsing message data and managing schemas * Resolving consumer lag issues in real-time * Controlling your entire Kafka Connect pipeline * Monitoring your Kafka Streams applications * Implementing enterprise-ready user controls for secure access Kpow fills that gap, providing a complete toolkit to manage and monitor your entire Kafka ecosystem on GCP with confidence. Ready to gain full visibility and control? Our new guide shows you…

7 часов назад @ reddit.com
Anyone tried Airbyte's new AI Assistant for pipeline health? How cool is it in practice?
Anyone tried Airbyte's new AI Assistant for pipeline health? How cool is it in practice?

Airbyte just released an AI assistant that claims to diagnose and fix failed syncs automatically. Sounds promising, but does it actually work in production? Would love real-world feedback before trying it on critical pipelines. submitted by /u/patatatatass [link] [comments]

8 часов назад @ reddit.com
Home assigment
Home assigment

Hello my DE fellows, i got a tech project case with a 2 days deadline, reading it i feel like it is way too much for a simple project case. Should i ignore it or in any do what i can in the timeframe? Here the task: Practical Project – Scraping Pipeline Objective Design and implement a resilient, scalable, and maintainable scraping pipeline that extracts, transforms, and stores data from multiple public web sources. Case: Monitoring Public Legislation in Latin America Your team must build a system for the periodic extraction of legislative bill data from the official portals of: Colombia: https://www.camara.gov.co/secretaria/proyectos-de-ley#menu Peru: https://www2.congreso.gob.pe/Sicr/TraD…

9 часов назад @ reddit.com
Python for DE interviews
Python for DE interviews

Data Engineers at Amazon or any MAANG, in your first technical rounds, do they ask about dataframe manipulations, working with JSONs, coding using Spark and Pandas in general? I am preparing leetcode questions for Python but should I expand my scope ? Edit to add background: I want to transition from a BIE to DE role and Python scares me. I can scope out leetcode Python and it has Pandas too. Do I need to learn more use-cases? submitted by /u/Individual_Risk9337 [link] [comments]

10 часов назад @ reddit.com
How important is a mentor early in your career?
How important is a mentor early in your career?

Was just wondering, if you’re not a prodigy then is not having a mentor going slow down your career growth and skill development? I’m personally a junior DE who just got promoted but due to language issues have very little experience/knowledge sharing with my senior coz English isn’t his first language. I’ve pretty much done everything myself in the last couple of years that I’ve been assigned with very minimal guidance from my senior but I’ve worked on tasks where he says do XYZ and you may want to look into ABC to get it done. Is that mentorship and are my expectations too high or is a mentors role more than that? submitted by /u/jnrdataengineer2023 [link] [comments]

11 часов назад @ reddit.com
Rest API ingestion
Rest API ingestion

Wondering about best practises around ingesting data from a Rest API to land in Databricks. I need to ingest from multiple endpoints and the end goal is to dump the raw data into a Databricks catalog (bronze layer). My current thought is to schedule an azure function to dump the data into a blob storage location and ingest the data into Databricks unity catalog using a file arrival trigger. Would appreciate some thoughts on my proposed approach. The API has multiple endpoints (8 or 9). Should I create a separate azure function for each endpoint or dynamically loop through each one within the same function. submitted by /u/SRobo97 [link] [comments]

11 часов назад @ reddit.com
Wife considering changing her career and I think data engineering could be an option
Wife considering changing her career and I think data engineering could be an option

Quick background information, I’m 33 and I have been working in the IT industry for about 15 years. I started with network than transitioned to Cloud Infrastructure and DevOps\IaC then Cloud Security and Security automation and now I am in MLOps and ML engineering. I have a somewhat successful career working 10 years in consulting and 3 years at Microsoft as a CSA. My wife is 29 years old, has a somewhat successful career on her filed which is Chemical Engineering. She started in the labs and moved to Quality Assurance investigator later on, she is now just got a job as a Team Lead in a quality assurance team for a manufacture company (big one). Now she is struggling with two things: As she…

11 часов назад @ reddit.com
Do you use multiplex on your bronze layer?
Do you use multiplex on your bronze layer?

On the Databricks professional cert they ask about implementing multiplex to "solve common issues with bronze ingestion." The pattern isn't new but I haven't seen it on other certifications. I tried to search for good documentation and using it at scale, but I cant find much. If you do use it, what issues ans successes have you had and at what scale? I feel the tight coupling can lead to issues but if you have 100s of small dim like tables it is probably great. submitted by /u/Thehollidayinn [link] [comments]

11 часов назад @ reddit.com
How good is data zoomcamp for beginners whi have Mechanical background?????
How good is data zoomcamp for beginners whi have Mechanical background?????

I'm a guy with basic coding knowledge like datatypes, libraries,functions, definitions, methods, loops, etc., Currently on a job hunt for DE roles with master's in information systems where i got interest in SQL coding. For a guy like me how good is Data engineering Zoomcamp. Do you guys suggest me on this??? submitted by /u/Tall_Ad_8216 [link] [comments]

14 часов назад @ reddit.com
How can I get better with learning API’s and API management?
How can I get better with learning API’s and API management?

I’ve noticed a bit of a weak point when it comes to my experience and that’s the use of API’s and blending that data with other sources. I’m confident in my abilities with typical ETL and data platforms and cloud data suites but just haven’t had much experience with managing API’s. I’m mostly looking for educational resources or platforms to improve my abilities in that realm, not just little REST api calls in a Python notebook as that’s easy but actual enterprise-scale API management submitted by /u/CorgiSideEye [link] [comments]

15 часов назад @ reddit.com
What kind of DE projects do companies expect from freshers?
What kind of DE projects do companies expect from freshers?

Hi, so I am final year student looking to enter into the data engineering domain. I want to build a few projects to learn the skills required. What kind of projects do Interviews and companies expect from a grad who is just starting out? What projects would help me build my skills? submitted by /u/Ordinary_Highlight81 [link] [comments]

15 часов назад @ reddit.com
I talked to someone telling Gen AI is going to take up the DE job
I talked to someone telling Gen AI is going to take up the DE job

I am preparing for data engineering jobs. This will be a switch in the career after 10 years in actuarial science (pension valuation). I have become really good at solving SQL questions on data lemur, leetcode. I am now working on a small ETL project. I talked to a data scientist. He told me that Gen AI is becoming really powerful and it will get difficult for data engineers. This has kinda demotivated me. I feel a little broken. I'm still at a stage where I still have to search and look for the next line of code. I know what should be the next logic though. At this point of time i don't know what to do. If I should keep moving forward or stick to my actuarial job where I'll be stuck becaus…

15 часов назад @ reddit.com
Sample Kafka & Similar Streaming Datasets
Sample Kafka & Similar Streaming Datasets

Hey Data Engineers, Where can I find sample Kafka & Similar Streaming Datasets? submitted by /u/AcanthisittaBroad765 [link] [comments]

17 часов назад @ reddit.com
Towards Data Science
последний пост 2 days, 7 hours назад
Why You Should Not Replace Blanks with 0 in Power BI
Why You Should Not Replace Blanks with 0 in Power BI

Did someone ask you to replace blank values with 0 in your reports? Maybe you should think twice before you do it!

The post Why You Should Not Replace Blanks with 0 in Power BI appeared first on Towards Data Science.

2 days, 7 hours назад @ towardsdatascience.com
Understanding Application Performance with Roofline Modeling
Understanding Application Performance with Roofline Modeling

A common challenge with calculating an application’s performance is that the real-world performance and theoretical performance can differ. With an ecosystem of products that is growing with high performance needs such as High Performance Computing (HPC), gaming, or in the current landscape – Large Language Models (LLMs), it is essential to calculate accurately the performance […]

The post Understanding Application Performance with Roofline Modeling appeared first on Towards Data Science.

2 days, 11 hours назад @ towardsdatascience.com
Beyond Model Stacking: The Architecture Principles That Make Multimodal AI Systems Work
Beyond Model Stacking: The Architecture Principles That Make Multimodal AI Systems Work

Transforming Independent Models into Collaborative Intelligence

The post Beyond Model Stacking: The Architecture Principles That Make Multimodal AI Systems Work appeared first on Towards Data Science.

3 days, 4 hours назад @ towardsdatascience.com
Understanding Matrices | Part 2: Matrix-Matrix Multiplication
Understanding Matrices | Part 2: Matrix-Matrix Multiplication

The physical meaning of multiplying two matrices and how it works on several special matrices.

The post Understanding Matrices | Part 2: Matrix-Matrix Multiplication appeared first on Towards Data Science.

3 days, 8 hours назад @ towardsdatascience.com
LLM-as-a-Judge: A Practical Guide
LLM-as-a-Judge: A Practical Guide

How to Scale LLM Evaluations Beyond Manual Review

The post LLM-as-a-Judge: A Practical Guide appeared first on Towards Data Science.

3 days, 9 hours назад @ towardsdatascience.com
From Configuration to Orchestration: Building an ETL Workflow with AWS Is No Longer a Struggle
From Configuration to Orchestration: Building an ETL Workflow with AWS Is No Longer a Struggle

A step-by-step guide to leverage AWS services for efficient data pipeline automation

The post From Configuration to Orchestration: Building an ETL Workflow with AWS Is No Longer a Struggle appeared first on Towards Data Science.

3 days, 11 hours назад @ towardsdatascience.com
What PyTorch Really Means by a Leaf Tensor and Its Grad
What PyTorch Really Means by a Leaf Tensor and Its Grad

The secret life of leaves, gradients, and the mighty requires_grad flag

The post What PyTorch Really Means by a Leaf Tensor and Its Grad appeared first on Towards Data Science.

3 days, 11 hours назад @ towardsdatascience.com
Beyond Code Generation: Continuously Evolve Text with LLMs
Beyond Code Generation: Continuously Evolve Text with LLMs

Long-running content evolution and an introduction to result analysis

The post Beyond Code Generation: Continuously Evolve Text with LLMs appeared first on Towards Data Science.

3 days, 22 hours назад @ towardsdatascience.com
Animating Linear Transformations with Quiver
Animating Linear Transformations with Quiver

A useful tool in your quiver

The post Animating Linear Transformations with Quiver appeared first on Towards Data Science.

4 days, 8 hours назад @ towardsdatascience.com
A Multi-Agent SQL Assistant You Can Trust with Human-in-Loop Checkpoint & LLM Cost Control
A Multi-Agent SQL Assistant You Can Trust with Human-in-Loop Checkpoint & LLM Cost Control

Your very own SQL assistant built with Streamlit, SQLite, & CrewAI

The post A Multi-Agent SQL Assistant You Can Trust with Human-in-Loop Checkpoint & LLM Cost Control appeared first on Towards Data Science.

4 days, 9 hours назад @ towardsdatascience.com
Can We Use Chess to Predict Soccer?
Can We Use Chess to Predict Soccer?

An adaptation of Elo ratings for soccer implemented in Python

The post Can We Use Chess to Predict Soccer? appeared first on Towards Data Science.

4 days, 10 hours назад @ towardsdatascience.com
Computer Vision’s Annotation Bottleneck Is Finally Breaking
Computer Vision’s Annotation Bottleneck Is Finally Breaking

A Technical Deep Dive into Auto-Labeling

The post Computer Vision’s Annotation Bottleneck Is Finally Breaking appeared first on Towards Data Science.

4 days, 11 hours назад @ towardsdatascience.com
Why Open Source is No Longer Optional — And How to Make it Work for Your Business
Why Open Source is No Longer Optional — And How to Make it Work for Your Business

To stay ahead, open source is the only way.

The post Why Open Source is No Longer Optional — And How to Make it Work for Your Business appeared first on Towards Data Science.

4 days, 12 hours назад @ towardsdatascience.com
Abstract Classes: A Software Engineering Concept Data Scientists Must Know To Succeed
Abstract Classes: A Software Engineering Concept Data Scientists Must Know To Succeed

Simple concepts that differentiate a professional from amateurs.

The post Abstract Classes: A Software Engineering Concept Data Scientists Must Know To Succeed appeared first on Towards Data Science.

5 days, 5 hours назад @ towardsdatascience.com
LLaVA on a Budget: Multimodal AI with Limited Resources
LLaVA on a Budget: Multimodal AI with Limited Resources

Let's get started with multimodality

The post LLaVA on a Budget: Multimodal AI with Limited Resources appeared first on Towards Data Science.

5 days, 10 hours назад @ towardsdatascience.com
Monte Carlo Data Monte Carlo Data
последний пост 1 month, 2 weeks назад
Best Data Observability Tools (with RFP Template)
Best Data Observability Tools (with RFP Template)

Monte Carlo is rated #1, but we recognize there are alternatives. Here's how the experts evaluate data observability tools.

1 month, 2 weeks назад @ montecarlodata.com
The Past, Present, and Future of Data Quality Management: Testing, Monitoring, and Data Observability in 2025
The Past, Present, and Future of Data Quality Management: Testing, Monitoring, and Data Observability in 2025

The data estate is evolving, and data quality management needs to evolve right along with it. Here are three common approaches and where the field is heading in the AI era.

2 months назад @ montecarlodata.com
Data Warehouse vs Data Lake vs Data Lakehouse: Definitions, Similarities, and Differences
Data Warehouse vs Data Lake vs Data Lakehouse: Definitions, Similarities, and Differences

Struggling to decide whether to invest in a data warehouse vs. data lake vs. lakehouse? Here's everything you need to know to make this decision.

2 months, 2 weeks назад @ montecarlodata.com
4 Native Snowflake Data Quality Checks & Features You Should Know
4 Native Snowflake Data Quality Checks & Features You Should Know

The bad news? Data breaks. The good news? These 4 Snowflake data quality checks & features can help!

9 months, 1 week назад @ montecarlodata.com
What is a Data Mesh — and How Not to Mesh it Up
What is a Data Mesh — and How Not to Mesh it Up

A beginner’s guide to implementing the latest industry trend: a data mesh.

9 months, 3 weeks назад @ montecarlodata.com
DE Telegram
DataEng DataEng
последний пост 9 months, 1 week назад
Building and scaling Notion’s data lakeВ июле этого года в блоге Notion вышла подробная статья об их опыте построении data lake: https://www.notion.so/blog/building-and-scaling-notions-data-lake
Building and scaling Notion’s data lakeВ июле этого года в блоге Notion вышла подробная статья об их опыте построении data lake: https://www.notion.so/blog/building-and-scaling-notions-data-lake

Building and scaling Notion’s data lakeВ июле этого года в блоге Notion вышла подробная статья об их опыте построении data lake: https://www.notion.so/blog/building-and-scaling-notions-data-lake

9 months, 1 week назад @ t.me
В блоге базы данных ClickHouse вышел интересный пост, направленный на PostgreSQL юзеров, в нём показаны ключевые различия между моделированием данных в ClickHouse и PostgreSQL: https://clickhouse.com/blog/postgres-to-clickhouse-data-modeling-tips
В блоге базы данных ClickHouse вышел интересный пост, направленный на PostgreSQL юзеров, в нём показаны ключевые различия между моделированием данных в ClickHouse и PostgreSQL: https://clickhouse.com/blog/postgres-to-clickhouse-data-modeling-tips

В блоге базы данных ClickHouse вышел интересный пост, направленный на PostgreSQL юзеров, в нём показаны ключевые различия между моделированием данных в ClickHouse и PostgreSQL: https://clickhouse.com/blog/postgres-to-clickhouse-data-modeling-tips

9 months, 1 week назад @ t.me
Нашел в Ютубе двухчасовой доклад про индексы в PostgreSQL: Индексы в PostgreSQL. Как понять, что создавать
Нашел в Ютубе двухчасовой доклад про индексы в PostgreSQL: Индексы в PostgreSQL. Как понять, что создавать

Нашел в Ютубе двухчасовой доклад про индексы в PostgreSQL: Индексы в PostgreSQL. Как понять, что создавать

9 months, 2 weeks назад @ t.me
Нашел в сети пост мини-книгу от небезызвестной Chip Huyen: Building A Generative AI PlatformПожалуй, это одно из самых подробных руководств про построение Generative AI платформ своими руками, или как сейчас говорят RAG in Production.
Нашел в сети пост мини-книгу от небезызвестной Chip Huyen: Building A Generative AI PlatformПожалуй, это одно из самых подробных руководств про построение Generative AI платформ своими руками, или как сейчас говорят RAG in Production.

Нашел в сети пост мини-книгу от небезызвестной Chip Huyen: Building A Generative AI PlatformПожалуй, это одно из самых подробных руководств про построение Generative AI платформ своими руками, или как сейчас говорят RAG in Production.

9 months, 2 weeks назад @ t.me
Гайд по промпт-инжинирингу от ребят из Anthropic: AI prompt engineering: A deep diveТакже в описании видео есть ссылка на их же мануал: https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview
Гайд по промпт-инжинирингу от ребят из Anthropic: AI prompt engineering: A deep diveТакже в описании видео есть ссылка на их же мануал: https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

Гайд по промпт-инжинирингу от ребят из Anthropic: AI prompt engineering: A deep diveТакже в описании видео есть ссылка на их же мануал: https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

9 months, 2 weeks назад @ t.me
DuckCon #5Плейлист с докладами из прошедшей конференции DuckCon #5:— DuckDB – Overview and latest developments— MotherDuck: Taking flight with interactive analytics— Outliers are all you need— Quack attack: Bringing DuckDB to the dart side— A duck for your
DuckCon #5Плейлист с докладами из прошедшей конференции DuckCon #5:— DuckDB – Overview and latest developments— MotherDuck: Taking flight with interactive analytics— Outliers are all you need— Quack attack: Bringing DuckDB to the dart side— A duck for your

DuckCon #5Плейлист с докладами из прошедшей конференции DuckCon #5:— DuckDB – Overview and latest developments— MotherDuck: Taking flight with interactive analytics— Outliers are all you need— Quack attack: Bringing DuckDB to the dart side— A duck for your dashboard: Performant data apps in the browser with DuckDB— Delighting users with RESTful APIs and DuckDB— Aerodynamic data models: Flying fast at scale with DuckDB— Double glazing: Two years of windowing improvements— dbverse: Composable database libraries for larger-than-memory scientific analytics— A quack at building scalable data pipelines with DuckDB

9 months, 2 weeks назад @ t.me
3-х часовой мастер-класс про LLM от Sebastian Raschka: Building LLMs from the Ground Up: A 3-hour Coding Workshop
3-х часовой мастер-класс про LLM от Sebastian Raschka: Building LLMs from the Ground Up: A 3-hour Coding Workshop

3-х часовой мастер-класс про LLM от Sebastian Raschka: Building LLMs from the Ground Up: A 3-hour Coding Workshop

9 months, 3 weeks назад @ t.me
Инжиниринг Данных Инжиниринг Данных
последний пост 1 day, 8 hours назад
Оказывается есть еще очень много компаний, которые используют Microsoft Reporting Service (SSRS). SSRS (SQL Server Reporting Services) был создан Microsoft и впервые представлен как часть SQL Server 2000 в 2004 году (в составе SQL Server 2000 Reporting Ser
Оказывается есть еще очень много компаний, которые используют Microsoft Reporting Service (SSRS). SSRS (SQL Server Reporting Services) был создан Microsoft и впервые представлен как часть SQL Server 2000 в 2004 году (в составе SQL Server 2000 Reporting Ser Оказывается есть еще очень много компаний, которые используют Microsoft Reporting Service (SSRS). SSRS (SQL Server Reporting Services) был создан Microsoft и впервые представлен как часть SQL Server 2000 в 2004 году (в составе SQL Server 2000 Reporting Ser

Оказывается есть еще очень много компаний, которые используют Microsoft Reporting Service (SSRS). SSRS (SQL Server Reporting Services) был создан Microsoft и впервые представлен как часть SQL Server 2000 в 2004 году (в составе SQL Server 2000 Reporting Services add-on, релиз - январь 2004). Основная цель - дать пользователям SQL Server инструмент для создания отчётов, который интегрируется с экосистемой Microsoft и конкурирует с Crystal Reports (в то время популярным решением).И вот, на конференции sqlBits в июне Microsoft объявил о завершении поддержки SSRS. В новом SQL Server будет уже Power BI Report Server (PBIRS), который будет работать с ключом лицензии SSRS.Но обещана поддержка до 20…

1 day, 8 hours назад @ t.me
Всем привет! В следующий четверг 26 июня мы проведем очередной онлайн-митап по lakehouse технологиям. В программе два доклада:Trino в Авито спустя два года: от движка к аналитической экосистеме, Дмитрий Рейман, АвитоКак Авито построил lakehouse-платформу н
Всем привет! В следующий четверг 26 июня мы проведем очередной онлайн-митап по lakehouse технологиям. В программе два доклада:Trino в Авито спустя два года: от движка к аналитической экосистеме, Дмитрий Рейман, АвитоКак Авито построил lakehouse-платформу н

Всем привет! В следующий четверг 26 июня мы проведем очередной онлайн-митап по lakehouse технологиям. В программе два доклада:Trino в Авито спустя два года: от движка к аналитической экосистеме, Дмитрий Рейман, АвитоКак Авито построил lakehouse-платформу на основе Trino, которая обрабатывает до 1 ПБ данных в день и обслуживает 300 пользователейCedrusData Catalog — Современный каталог для lakehouse-платформ, Владимир Озеров, Кверифай ЛабсАрхитектура и возможности CedrusData Catalog — бесплатного каталога Iceberg для российского рынка. Ролевая модель доступа, обслуживание таблиц Iceberg, time-travel, ускорение аналитических запросов.Регистрация: https://cedrusdata.timepad.ru/event/3426242/

1 day, 11 hours назад @ t.me
VC заинвестировали больше 73 лярдов в AI стартапы в 2025, и теперь кошечки прыгают в олимпийский бассейн как настоящие. https://youtube.com/shorts/Z_hSnPzztpA
VC заинвестировали больше 73 лярдов в AI стартапы в 2025, и теперь кошечки прыгают в олимпийский бассейн как настоящие. https://youtube.com/shorts/Z_hSnPzztpA

VC заинвестировали больше 73 лярдов в AI стартапы в 2025, и теперь кошечки прыгают в олимпийский бассейн как настоящие. https://youtube.com/shorts/Z_hSnPzztpA

2 days, 4 hours назад @ t.me
Игра симулятор про CDO, попробуйте, получилось прикольно https://www.whoisthebestcdo.com
Игра симулятор про CDO, попробуйте, получилось прикольно https://www.whoisthebestcdo.com

Игра симулятор про CDO, попробуйте, получилось прикольно https://www.whoisthebestcdo.com

4 days назад @ t.me
Labuba и Vibe CodingНедавно дочка загорелась монстриками Labuba. Это такие брелоки - стоят недорого, но достать их почти невозможно. Кто-то вешает их на дорогие сумки, кто-то кринжует по-другому.Дочка захотела Labuba. Окей, подумал я, всего-то $30. Нашёл с
Labuba и Vibe CodingНедавно дочка загорелась монстриками Labuba. Это такие брелоки - стоят недорого, но достать их почти невозможно. Кто-то вешает их на дорогие сумки, кто-то кринжует по-другому.Дочка захотела Labuba. Окей, подумал я, всего-то $30. Нашёл с Labuba и Vibe CodingНедавно дочка загорелась монстриками Labuba. Это такие брелоки - стоят недорого, но достать их почти невозможно. Кто-то вешает их на дорогие сумки, кто-то кринжует по-другому.Дочка захотела Labuba. Окей, подумал я, всего-то $30. Нашёл с

Labuba и Vibe CodingНедавно дочка загорелась монстриками Labuba. Это такие брелоки - стоят недорого, но достать их почти невозможно. Кто-то вешает их на дорогие сумки, кто-то кринжует по-другому.Дочка захотела Labuba. Окей, подумал я, всего-то $30. Нашёл сайт, где их продают - https://www.popmart.com/ca, и понял, что там какие-то дропы: ограниченное количество игрушек.Была надпись: старт продаж в 18:30. Я поставил будильник на 18:25. Зашёл на сайт и начал кликать. Сайт дико тормозил, и уже в 18:30 все игрушки были зарезервированы.«Так значит?» - подумал я. У меня же есть Cursor. Сейчас как на вайбе закодю - мало не покажется.Поставил себе задачу для плагина:- Зайти на сайт- Ровно в 18:30 на…

5 days, 4 hours назад @ t.me
Всем привет, в продолжение data&drinks 🌎, давай встретимся:- 27 или 28 июня в Чикаго- 20 или 21 августа в ДенвереЕсли вы из этих городов пишите в комментах или в личку!
Всем привет, в продолжение data&drinks 🌎, давай встретимся:- 27 или 28 июня в Чикаго- 20 или 21 августа в ДенвереЕсли вы из этих городов пишите в комментах или в личку! Всем привет, в продолжение data&drinks 🌎, давай встретимся:- 27 или 28 июня в Чикаго- 20 или 21 августа в ДенвереЕсли вы из этих городов пишите в комментах или в личку!

Всем привет, в продолжение data&drinks 🌎, давай встретимся:- 27 или 28 июня в Чикаго- 20 или 21 августа в ДенвереЕсли вы из этих городов пишите в комментах или в личку!

1 week назад @ t.me
В прошлом году мы сделали небольшой surf camp в Тофино, на Бергу Тихого океана. В этом году мы тоже решили сделать небольшой camp: 30 июня по 3 июля. Присоединяйтесь:)
В прошлом году мы сделали небольшой surf camp в Тофино, на Бергу Тихого океана. В этом году мы тоже решили сделать небольшой camp: 30 июня по 3 июля. Присоединяйтесь:)

В прошлом году мы сделали небольшой surf camp в Тофино, на Бергу Тихого океана. В этом году мы тоже решили сделать небольшой camp: 30 июня по 3 июля. Присоединяйтесь:)

1 week, 4 days назад @ t.me
📖 SLOW PRODUCTIVITY: THE LOST ART OF ACCOMPLISHMENT WITHOUT BURNOUT (2024)Cal Newport#лучшее#безперевода✏️ О КНИГЕКэл Ньюпорт написал очень актуальную и своевременную книгу с тремя принципами «медленной продуктивности». Это и интересное чтение с примерами
📖 SLOW PRODUCTIVITY: THE LOST ART OF ACCOMPLISHMENT WITHOUT BURNOUT (2024)Cal Newport#лучшее#безперевода✏️ О КНИГЕКэл Ньюпорт написал очень актуальную и своевременную книгу с тремя принципами «медленной продуктивности». Это и интересное чтение с примерами 📖 SLOW PRODUCTIVITY: THE LOST ART OF ACCOMPLISHMENT WITHOUT BURNOUT (2024)Cal Newport#лучшее#безперевода✏️ О КНИГЕКэл Ньюпорт написал очень актуальную и своевременную книгу с тремя принципами «медленной продуктивности». Это и интересное чтение с примерами

📖 SLOW PRODUCTIVITY: THE LOST ART OF ACCOMPLISHMENT WITHOUT BURNOUT (2024)Cal Newport#лучшее#безперевода✏️ О КНИГЕКэл Ньюпорт написал очень актуальную и своевременную книгу с тремя принципами «медленной продуктивности». Это и интересное чтение с примерами и размышлениями о природе продуктивности и умственной работы в современном мире, и конкретные рекомендации по достижению результатов в ваших проектах (ведь, как известно, «быстро — это медленно без перерывов»).Он предлагает фокусироваться на качестве, а не количестве, и ограничивать число проектов в работе. Число часов в сутках ограничено, и с ростом числа проектов накладные временные расходы будут съедать всё больше времени, которое приго…

1 week, 4 days назад @ t.me
Недавно увидел хорошие термины про тип работы - deep work vs shallow work.Deep work - глубокое погружение в работу, которое позволяет сосредоточиться на проблеме, изучить необходимые технологии и процессы. Обычно такая работа требует как минимум несколько
Недавно увидел хорошие термины про тип работы - deep work vs shallow work.Deep work - глубокое погружение в работу, которое позволяет сосредоточиться на проблеме, изучить необходимые технологии и процессы. Обычно такая работа требует как минимум несколько

Недавно увидел хорошие термины про тип работы - deep work vs shallow work.Deep work - глубокое погружение в работу, которое позволяет сосредоточиться на проблеме, изучить необходимые технологии и процессы. Обычно такая работа требует как минимум несколько часов без отвлечений, и по окончании процесса вы получаете удовлетворение. От такой напряжённой работы вы не так устаете и не выгораете.Shallow work, напротив, - это работа урывками, когда часто меняется контекст между задачами и проектами.Даже хорошо спланированную работу в формате deep work можно легко превратить в shallow work. Достаточно начать реагировать на сообщения в мессенджере от коллег, менеджеров, друзей. Или участвовать в част…

1 week, 6 days назад @ t.me
🚀 Yandex Cloud запустил сертификацию по DataLens.DataLens — это BI-инструмент, с которым можно быстро собрать дашборд и не тратить часы на настройку. Часто используется в продакшене: отлично подходит для оперативной проверки гипотез или подготовки витрин «
🚀 Yandex Cloud запустил сертификацию по DataLens.DataLens — это BI-инструмент, с которым можно быстро собрать дашборд и не тратить часы на настройку. Часто используется в продакшене: отлично подходит для оперативной проверки гипотез или подготовки витрин « 🚀 Yandex Cloud запустил сертификацию по DataLens.DataLens — это BI-инструмент, с которым можно быстро собрать дашборд и не тратить часы на настройку. Часто используется в продакшене: отлично подходит для оперативной проверки гипотез или подготовки витрин «

🚀 Yandex Cloud запустил сертификацию по DataLens.DataLens — это BI-инструмент, с которым можно быстро собрать дашборд и не тратить часы на настройку. Часто используется в продакшене: отлично подходит для оперативной проверки гипотез или подготовки витрин «на посмотреть» для бизнеса. Из коробки доступны графики, фильтры, датасеты, подключение к источникам — всё визуализируется с минимальными усилиями.Сертификация — это не просто формальность, а способ систематизировать знания и убедиться, что инструмент освоен на практике. Доступны подготовительные материалы, бесплатный курс и примеры заданий — всё собрано на одной странице. Уровень — junior+, но для тех, кто регулярно работает с BI и аналит…

2 weeks назад @ t.me
Всем хороших выходных! Для меня бутылочка сидра в компании жены лучшая награда за 6 рабочих дней:) PS в пятницу записал для Surfalytics первый эпизод mock Data Engineering System Design interview, использовали Azure cloud. PPS интересный факт, стаканы из I
Всем хороших выходных! Для меня бутылочка сидра в компании жены лучшая награда за 6 рабочих дней:) PS в пятницу записал для Surfalytics первый эпизод mock Data Engineering System Design interview, использовали Azure cloud. PPS интересный факт, стаканы из I Всем хороших выходных! Для меня бутылочка сидра в компании жены лучшая награда за 6 рабочих дней:) PS в пятницу записал для Surfalytics первый эпизод mock Data Engineering System Design interview, использовали Azure cloud. PPS интересный факт, стаканы из I

Всем хороших выходных! Для меня бутылочка сидра в компании жены лучшая награда за 6 рабочих дней:) PS в пятницу записал для Surfalytics первый эпизод mock Data Engineering System Design interview, использовали Azure cloud. PPS интересный факт, стаканы из IKEA, но made in Russia😊

2 weeks, 1 day назад @ t.me
Ищете работу на международном рынке?Тогда канал Connectable Jobs будет полезен для вас. Ребята собирают вакансии в международных стартапах с русскоязычными фаундерами, делятся важной информацией про команды и инвестиции, а также прямыми контактами HR для у
Ищете работу на международном рынке?Тогда канал Connectable Jobs будет полезен для вас. Ребята собирают вакансии в международных стартапах с русскоязычными фаундерами, делятся важной информацией про команды и инвестиции, а также прямыми контактами HR для у

Ищете работу на международном рынке?Тогда канал Connectable Jobs будет полезен для вас. Ребята собирают вакансии в международных стартапах с русскоязычными фаундерами, делятся важной информацией про команды и инвестиции, а также прямыми контактами HR для удобного отклика. Вот несколько актуальных вакансий таких компаниях:— Head of Data в Manychat— Data Engineer в Constructor— Lead of Engineering в AppodealЕще у Connectable Jobs есть отдельный канал для разработчиков и инженеров, где публикуются вакансии только в этой области.Подписывайтесь и развивайте карьеру в будущем единороге 🚀

2 weeks, 3 days назад @ t.me
Data-driven культура часто выглядит как BI инструмент(ы) с метриками и дашбордами + хранилище данных (хотя уже модно делать Data Lakeuse на 500ТБ 🤔). В идеале культура, основанная на данных, должна включать три ключевых элемента — так называемый 3P framewo
Data-driven культура часто выглядит как BI инструмент(ы) с метриками и дашбордами + хранилище данных (хотя уже модно делать Data Lakeuse на 500ТБ 🤔). В идеале культура, основанная на данных, должна включать три ключевых элемента — так называемый 3P framewo

Data-driven культура часто выглядит как BI инструмент(ы) с метриками и дашбордами + хранилище данных (хотя уже модно делать Data Lakeuse на 500ТБ 🤔). В идеале культура, основанная на данных, должна включать три ключевых элемента — так называемый 3P framework:- People - вовлечённые сотрудники и поддержка со стороны руководства.- Platform - удобные и доступные инструменты (BI-системы, дашборды, ноутбуки, хранилища и т. п.).- Process - процессы, которые помогают извлекать инсайты и превращать их в действия, с акцентом на качество данных, метрики и бизнес-приоритеты.В такой культуре важно позволять людям экспериментировать с данными, поощрять стремление к обучению и развитию, задавать бизнес-во…

2 weeks, 4 days назад @ t.me
Приходите на прямой эфир по архитектуре данных и Data Lakehouse5 июня, в 17:00 по Москве канал Данные на стероидах проводит прямой эфир с двумя экспертами-архитекторами. Спикерами станут Алексей Белозерский, руководитель команды BigData Services VK Cloud,
Приходите на прямой эфир по архитектуре данных и Data Lakehouse5 июня, в 17:00 по Москве канал Данные на стероидах проводит прямой эфир с двумя экспертами-архитекторами. Спикерами станут Алексей Белозерский, руководитель команды BigData Services VK Cloud, Приходите на прямой эфир по архитектуре данных и Data Lakehouse5 июня, в 17:00 по Москве канал Данные на стероидах проводит прямой эфир с двумя экспертами-архитекторами. Спикерами станут Алексей Белозерский, руководитель команды BigData Services VK Cloud,

Приходите на прямой эфир по архитектуре данных и Data Lakehouse5 июня, в 17:00 по Москве канал Данные на стероидах проводит прямой эфир с двумя экспертами-архитекторами. Спикерами станут Алексей Белозерский, руководитель команды BigData Services VK Cloud, а также Вадим Белов, руководитель системной разработки DMP, Х5 Group. 👉 Подписывайтесь на канал, чтобы послушать эфирОсновная тема дискуссии: Data Lakehouse — хайп или необходимость. Во время прямого эфира вы сможете задать вопросы экспертам и поделиться своим опытом.Кому будет особенно интересно залететь в трансляцию: 🎯 Дата-инженерам🎯 Руководителям дата-платформ 🎯 Аналитикам 🎯 Архитекторам🎯 CDO, CDTO

2 weeks, 4 days назад @ t.me
Все знакомы с понятием Ad-hoc запросов. Обычно мы воспринимаем их негативно, так как они отвлекают, время-то и так мало. На самом деле, ad-hoc запросы могут бысть источником quick wins, и способом быстро показать impact и завоевать доверие (earn trust).Ad-
Все знакомы с понятием Ad-hoc запросов. Обычно мы воспринимаем их негативно, так как они отвлекают, время-то и так мало. На самом деле, ad-hoc запросы могут бысть источником quick wins, и способом быстро показать impact и завоевать доверие (earn trust).Ad-

Все знакомы с понятием Ad-hoc запросов. Обычно мы воспринимаем их негативно, так как они отвлекают, время-то и так мало. На самом деле, ad-hoc запросы могут бысть источником quick wins, и способом быстро показать impact и завоевать доверие (earn trust).Ad-hoc — это не бардак. Это VIP-запросы, которые показывают: вам доверяют. Ваша задача - не утонуть, а превратить это в рычаг для влияния.Вот пример фреймфорка:1. Принять быстроОтвет в течение пары минут (или автоответ, если в фокусе) показывает: у нас есть процесс, а не паника.2. Быстрое фильтрование (2 минуты):- Это повлияет на $Xk+ или стратегию?- Нужно на этой неделе для принятия решений?- Делается за полдня одним аналитиком?- Если да → д…

2 weeks, 5 days назад @ t.me
Left Join Left Join
последний пост 2 days, 18 hours назад
У аналитиков свои марафоныС приходом тепла все парки (и соцсети заодно) захватывают любители бега, хвастаются медалями и преодоленными километрами. А на выходных еще и дороги перекрывают для очередного городского марафона.У нас тоже есть свой марафон — тол
У аналитиков свои марафоныС приходом тепла все парки (и соцсети заодно) захватывают любители бега, хвастаются медалями и преодоленными километрами. А на выходных еще и дороги перекрывают для очередного городского марафона.У нас тоже есть свой марафон — тол У аналитиков свои марафоныС приходом тепла все парки (и соцсети заодно) захватывают любители бега, хвастаются медалями и преодоленными километрами. А на выходных еще и дороги перекрывают для очередного городского марафона.У нас тоже есть свой марафон — тол

У аналитиков свои марафоныС приходом тепла все парки (и соцсети заодно) захватывают любители бега, хвастаются медалями и преодоленными километрами. А на выходных еще и дороги перекрывают для очередного городского марафона.У нас тоже есть свой марафон — только особенный, специально для тех, кто бегать не хочет и дороги перекрывать не собирается.🔜 Это, конечно, «Марафон знаний» — бесплатный курс по SQL и Python, разработанный нашей командой.Курс рассчитан на людей, которые начинают знакомство с аналитикой — для студентов, джунов и тех, кто только задумывается о работе в этой сфере.«Марафон знаний» не просто дает теорию по SQL и Python, но и помогает получше узнать, что из себя представляет пр…

2 days, 18 hours назад @ t.me
Почему разговаривать с компьютерами — плохая идеяНо не всегда.Скорое наступление эры умных компьютеров, с которыми можно говорить, как с человеком, предсказывают еще с момента появления голосовых ассистентов вроде Siri. Потом были умные колонки вроде Alexa
Почему разговаривать с компьютерами — плохая идеяНо не всегда.Скорое наступление эры умных компьютеров, с которыми можно говорить, как с человеком, предсказывают еще с момента появления голосовых ассистентов вроде Siri. Потом были умные колонки вроде Alexa

Почему разговаривать с компьютерами — плохая идеяНо не всегда.Скорое наступление эры умных компьютеров, с которыми можно говорить, как с человеком, предсказывают еще с момента появления голосовых ассистентов вроде Siri. Потом были умные колонки вроде Alexa, а вот теперь — ИИ-помощники и чат-боты с LLM под капотом, которых добавляют во все сервисы и приложения подряд.Но теперь давайте честно — сколько людей на самом деле пользуются этими ИИ-ассистентами? Если что, вопрос не риторический, пишите ответы в комментах. Каждая новая технология оказывается на деле не такой прорывной, как на словах, и все ждут следующую итерацию, которая точно изменит мир.👀 Но может быть на самом деле нам это не нуж…

4 days, 19 hours назад @ t.me
Онлайн-магистратура по дата-аналитике: набор открыт!Онлайн-курсам часто не хватает фундаментальной вузовской базы, а многие университетские программы не успевают за развитием индустрии и не дают актуальные знания. Институт искусственного интеллекта и анали
Онлайн-магистратура по дата-аналитике: набор открыт!Онлайн-курсам часто не хватает фундаментальной вузовской базы, а многие университетские программы не успевают за развитием индустрии и не дают актуальные знания. Институт искусственного интеллекта и анали Онлайн-магистратура по дата-аналитике: набор открыт!Онлайн-курсам часто не хватает фундаментальной вузовской базы, а многие университетские программы не успевают за развитием индустрии и не дают актуальные знания. Институт искусственного интеллекта и анали

Онлайн-магистратура по дата-аналитике: набор открыт!Онлайн-курсам часто не хватает фундаментальной вузовской базы, а многие университетские программы не успевают за развитием индустрии и не дают актуальные знания. Институт искусственного интеллекта и анализа больших данных BASAND.AI ТГУ совместно с Академией Дата-Дайвинг разработали онлайн-магистратуру, которая решает обе эти проблемы. Программа «Дата-аналитика для бизнеса» создана, чтобы готовить специалистов, которые умеют не просто строить графики, а решать реальные бизнес-задачи с помощью данных по трем направлениям: 🔵продуктовая аналитика,🔵маркетинговая аналитика,🔵BI-аналитика.Студенты учатся онлайн, но со всеми плюсами очного образова…

6 days, 17 hours назад @ t.me
Про превосходство таблиц над пончикамиПайчарты и их разновидности (вроде «пончиков» из заголовка, которые те же пайчарты, по сути, просто с дыркой в центре) — парадоксальный способ визуализации данных.🔜 С одной стороны, это один из самых популярных чартов,
Про превосходство таблиц над пончикамиПайчарты и их разновидности (вроде «пончиков» из заголовка, которые те же пайчарты, по сути, просто с дыркой в центре) — парадоксальный способ визуализации данных.🔜 С одной стороны, это один из самых популярных чартов, Про превосходство таблиц над пончикамиПайчарты и их разновидности (вроде «пончиков» из заголовка, которые те же пайчарты, по сути, просто с дыркой в центре) — парадоксальный способ визуализации данных.🔜 С одной стороны, это один из самых популярных чартов,

Про превосходство таблиц над пончикамиПайчарты и их разновидности (вроде «пончиков» из заголовка, которые те же пайчарты, по сути, просто с дыркой в центре) — парадоксальный способ визуализации данных.🔜 С одной стороны, это один из самых популярных чартов, которые хотя бы иногда используют все: от аналитиков и спецов по датавизу до школьников и студентов, которые готовят презентации для уроков. Это очевидный и интуитивный способ показать соотношение долей.🔜 С другой стороны, многие их не любят, считая неудобными и неинформативными: якобы все, что можно изобразить на пайчарте, можно намного эффективнее и понятнее показать на каком-нибудь другом графике. Если вы подумали, что сейчас мы этот т…

1 week, 2 days назад @ t.me
А вы видели топ книжных бестселлеров мая?«Причем здесь аналитика и книжные бестселлеры?» — спросите вы.А при том, что в этот топ попала книга Николая Валиотти «Аналитика для руководителей»! 🔥Мы про нее уже много раз рассказывали на этом канале, поэтому не
А вы видели топ книжных бестселлеров мая?«Причем здесь аналитика и книжные бестселлеры?» — спросите вы.А при том, что в этот топ попала книга Николая Валиотти «Аналитика для руководителей»! 🔥Мы про нее уже много раз рассказывали на этом канале, поэтому не А вы видели топ книжных бестселлеров мая?«Причем здесь аналитика и книжные бестселлеры?» — спросите вы.А при том, что в этот топ попала книга Николая Валиотти «Аналитика для руководителей»! 🔥Мы про нее уже много раз рассказывали на этом канале, поэтому не

А вы видели топ книжных бестселлеров мая?«Причем здесь аналитика и книжные бестселлеры?» — спросите вы.А при том, что в этот топ попала книга Николая Валиотти «Аналитика для руководителей»! 🔥Мы про нее уже много раз рассказывали на этом канале, поэтому не будем повторяться — ну почти. Просто напомним про лендинг c ссылками на все магазины, где вы можете ее купить, если еще этого не сделали.

1 week, 3 days назад @ t.me
Редкое явление для нашего острова!Зато под одной крышей солидная кучка дата инженеров и дата аналитиков!
Редкое явление для нашего острова!Зато под одной крышей солидная кучка дата инженеров и дата аналитиков! Редкое явление для нашего острова!Зато под одной крышей солидная кучка дата инженеров и дата аналитиков!

Редкое явление для нашего острова!Зато под одной крышей солидная кучка дата инженеров и дата аналитиков!

1 week, 5 days назад @ t.me
Максимальное спасибо @valiotti и @cyprusdata за организацию этого эвента!Если вы на Кипре и вы хотите быть в курсе дата-событий и понетворкаться и пообсуждать датку -> вступайте (через формочку) https://tally.so/r/nPpOEP
Максимальное спасибо @valiotti и @cyprusdata за организацию этого эвента!Если вы на Кипре и вы хотите быть в курсе дата-событий и понетворкаться и пообсуждать датку -> вступайте (через формочку) https://tally.so/r/nPpOEP

Максимальное спасибо @valiotti и @cyprusdata за организацию этого эвента!Если вы на Кипре и вы хотите быть в курсе дата-событий и понетворкаться и пообсуждать датку -> вступайте (через формочку) https://tally.so/r/nPpOEP

1 week, 5 days назад @ t.me
Как работают data-специалисты в 2025?Инженеры, аналитики, дата-сайентисты, ML-специалисты — как у вас дела? Как работа? Чем вы занимаетесь и какие инструменты используете?А хотите не только про себя рассказать, но и узнать, как дела у коллег?🔵Узнать про тр
Как работают data-специалисты в 2025?Инженеры, аналитики, дата-сайентисты, ML-специалисты — как у вас дела? Как работа? Чем вы занимаетесь и какие инструменты используете?А хотите не только про себя рассказать, но и узнать, как дела у коллег?🔵Узнать про тр Как работают data-специалисты в 2025?Инженеры, аналитики, дата-сайентисты, ML-специалисты — как у вас дела? Как работа? Чем вы занимаетесь и какие инструменты используете?А хотите не только про себя рассказать, но и узнать, как дела у коллег?🔵Узнать про тр

Как работают data-специалисты в 2025?Инженеры, аналитики, дата-сайентисты, ML-специалисты — как у вас дела? Как работа? Чем вы занимаетесь и какие инструменты используете?А хотите не только про себя рассказать, но и узнать, как дела у коллег?🔵Узнать про тренды в индустрии и набирающие популярность инструменты.🔵Увидеть, как обстоят дела на рынке труда и сколько работодатели готовы специалистам вашего профиля.🔵Подсмотреть, как устроены рабочие процессы в других компаниях и перенять лучший опыт.Тогда пройдите опрос от команды DevCrowd. Он займет 15 минут и поможет составить честную и объективную картину data-рынка в 2025 году. Результаты выложат в открытый доступ в августе.🔜 Пройти опросP.S. А…

1 week, 5 days назад @ t.me
Неуверенный калькуляторБыло бы здорово, если бы все в этом мире было точно и однозначно, особенно, когда речь идет о цифрах. Например, когда вы планируете переезд в другой город или хотите прикинуть доход от инвестиций.Но так бывает не всегда, и нам регуля
Неуверенный калькуляторБыло бы здорово, если бы все в этом мире было точно и однозначно, особенно, когда речь идет о цифрах. Например, когда вы планируете переезд в другой город или хотите прикинуть доход от инвестиций.Но так бывает не всегда, и нам регуля

Неуверенный калькуляторБыло бы здорово, если бы все в этом мире было точно и однозначно, особенно, когда речь идет о цифрах. Например, когда вы планируете переезд в другой город или хотите прикинуть доход от инвестиций.Но так бывает не всегда, и нам регулярно приходится иметь дело с неопределенностью, когда в уравнении слишком много переменных. Вместо точных цифр — размытое «зарплата от 50 до 150к», «ремонт будет стоить то ли 10 000, то ли 100 000 и займет где-то от недели до полугода» и все в таком духе.И как быть?🔜 Вечный вопрос, на который у нас наконец-то есть ответ — использовать неуверенный калькулятор. Суть проста: вы вносите в него не точные цифры, а диапазон от минимального возможн…

2 weeks, 2 days назад @ t.me
Быстрее, выше, сильнее: что нового у dbt 28 мая dbt провела Launch Showcase, где представила сразу несколько крупных изменений. 🔵dbt Fusion — новый движок, который будет в 30 раз быстрее старого. Он сможет проверять правильность SQL-запроса и выдавать подс
Быстрее, выше, сильнее: что нового у dbt 28 мая dbt провела Launch Showcase, где представила сразу несколько крупных изменений. 🔵dbt Fusion — новый движок, который будет в 30 раз быстрее старого. Он сможет проверять правильность SQL-запроса и выдавать подс

Быстрее, выше, сильнее: что нового у dbt 28 мая dbt провела Launch Showcase, где представила сразу несколько крупных изменений. 🔵dbt Fusion — новый движок, который будет в 30 раз быстрее старого. Он сможет проверять правильность SQL-запроса и выдавать подсказки с учетом контекста, а также на 10% (а то и больше!) снизить расходы на хранение данных. 🔵Расширение dbt VS Code — чтобы все новые фичи dbt стали доступны и в VS Code.🔵dbt MCP Server — инструмент для интеграции LLM в проекты в dbt.🔵dbt Canvas, dbt Insights и dbt Catalog (бывший dbt Explorer) — инструменты для аналитиков, которые сделают удобнее и проще работу с данными. В Canvas можно будет простым drag-and-drop строить и редактироват…

3 weeks, 2 days назад @ t.me
"Нашу маму и там, и тут показывают" — LEFT JOIN на Aha!25Пусть в этом году команда LEFT JOIN не смогла присоединиться к конференции физически, мы все равно не могли это пропустить. Передаем привет и желаем послушать как можно больше крутых выступлений — а
"Нашу маму и там, и тут показывают" — LEFT JOIN на Aha!25Пусть в этом году команда LEFT JOIN не смогла присоединиться к конференции физически, мы все равно не могли это пропустить. Передаем привет и желаем послушать как можно больше крутых выступлений — а

"Нашу маму и там, и тут показывают" — LEFT JOIN на Aha!25Пусть в этом году команда LEFT JOIN не смогла присоединиться к конференции физически, мы все равно не могли это пропустить. Передаем привет и желаем послушать как можно больше крутых выступлений — а перерывах поймать наше видео на экранах в фойе "Ломоносова"!

3 weeks, 3 days назад @ t.me
DataLens открывает галерею дашбордов и не толькоЛюбите иногда позалипать повдохновляться на Tableau Public? Да, мы тоже — а кто не любит?Теперь то же самое можно будет сделать, но с дашбордами на Yandex DataLens — сервис запускает DataLens Gallery. Это гал
DataLens открывает галерею дашбордов и не толькоЛюбите иногда позалипать повдохновляться на Tableau Public? Да, мы тоже — а кто не любит?Теперь то же самое можно будет сделать, но с дашбордами на Yandex DataLens — сервис запускает DataLens Gallery. Это гал DataLens открывает галерею дашбордов и не толькоЛюбите иногда позалипать повдохновляться на Tableau Public? Да, мы тоже — а кто не любит?Теперь то же самое можно будет сделать, но с дашбордами на Yandex DataLens — сервис запускает DataLens Gallery. Это гал

DataLens открывает галерею дашбордов и не толькоЛюбите иногда позалипать повдохновляться на Tableau Public? Да, мы тоже — а кто не любит?Теперь то же самое можно будет сделать, но с дашбордами на Yandex DataLens — сервис запускает DataLens Gallery. Это галерея с готовыми примерами дашбордов и чартов. Можно будет как добавить свою работу, так и посмотреть чужие, еще и с разбивкой по отраслям. Особенно понравившиеся даже можно будет развернуть у себя — если автор дал разрешение.Кроме того, DataLens запускает:🔵Editor — JavaScript-редактор для кастомизации графиков и таблиц с поддержкой интеграции данных из разных источников, включая внешние API. Он нацелен на опытных аналитиков, но в будущем п…

3 weeks, 4 days назад @ t.me
От запроса до результата: как работает SQL-движокSQL-движок — это логический уровень между пользователем и данными в базе, который отвечает за обработку запроса и формирование результата. Но как он это делает? Один из авторов проекта Dolt (как его описываю
От запроса до результата: как работает SQL-движокSQL-движок — это логический уровень между пользователем и данными в базе, который отвечает за обработку запроса и формирование результата. Но как он это делает? Один из авторов проекта Dolt (как его описываю

От запроса до результата: как работает SQL-движокSQL-движок — это логический уровень между пользователем и данными в базе, который отвечает за обработку запроса и формирование результата. Но как он это делает? Один из авторов проекта Dolt (как его описывают сами разработчики — БД, которая работает, как репозиторий на GitHub) написал целую статью про опыт работы с их движком go-mysql-server. Хотя акцент именно на этот движок, он также рассказывает про разные подходы и принципы работы SQL-движков в целом. Если кратко:🔵Выполнение запроса можно разделить на 7 шагов — парсинг, привязка к данным в БД, упрощение плана выполнения, оптимизация порядка выполнения джойнов, оценка эффективности плана, …

3 weeks, 5 days назад @ t.me
Что объединяет аналитиков, продактов, CPO, CDO и ML-разработчиков?Aha!25 — конференция про то, как решать продуктовые задачи с помощью ML, аналитики и data-driven подхода.2 дня, 16 тематических потоков, более 1200 участников и доклады от практиков из Яндек
Что объединяет аналитиков, продактов, CPO, CDO и ML-разработчиков?Aha!25 — конференция про то, как решать продуктовые задачи с помощью ML, аналитики и data-driven подхода.2 дня, 16 тематических потоков, более 1200 участников и доклады от практиков из Яндек Что объединяет аналитиков, продактов, CPO, CDO и ML-разработчиков?Aha!25 — конференция про то, как решать продуктовые задачи с помощью ML, аналитики и data-driven подхода.2 дня, 16 тематических потоков, более 1200 участников и доклады от практиков из Яндек

Что объединяет аналитиков, продактов, CPO, CDO и ML-разработчиков?Aha!25 — конференция про то, как решать продуктовые задачи с помощью ML, аналитики и data-driven подхода.2 дня, 16 тематических потоков, более 1200 участников и доклады от практиков из Яндекса, Авито, OZON, Т-Банка, Альфа-Банка, а также исследователей из ИТМО, РЭШ, МФТИ и других научных центров. На Aha!25 обсудят актуальные вопросы, над которыми многие задумываются, но не все находят ответ.• Что делать, когда A/B-тест дает противоречивые результаты?• Как проводить эксперименты и трактовать результаты?• Как встраивать ML и ИИ в продукты с пользой для дела — а как это делать точно не надо?• Как поведенческая экономика помогает …

4 weeks, 1 day назад @ t.me
Когда BI — это не просто отчеты, а полезный инструмент для бизнесаВо многих компаниях аналитика ограничивается созданием пачки дашбордов, которые существуют как будто просто для красоты. Они есть, пользователи в них иногда задумчиво смотрят, но для приняти
Когда BI — это не просто отчеты, а полезный инструмент для бизнесаВо многих компаниях аналитика ограничивается созданием пачки дашбордов, которые существуют как будто просто для красоты. Они есть, пользователи в них иногда задумчиво смотрят, но для приняти Когда BI — это не просто отчеты, а полезный инструмент для бизнесаВо многих компаниях аналитика ограничивается созданием пачки дашбордов, которые существуют как будто просто для красоты. Они есть, пользователи в них иногда задумчиво смотрят, но для приняти

Когда BI — это не просто отчеты, а полезный инструмент для бизнесаВо многих компаниях аналитика ограничивается созданием пачки дашбордов, которые существуют как будто просто для красоты. Они есть, пользователи в них иногда задумчиво смотрят, но для принятия решений все так же используют интуицию, а не данные.Зато когда BI-стратегия выстроена правильно, она становится частью управленческой системы: помогает расставлять приоритеты и контролировать результаты. Но чтобы к этому прийти, понадобится не только знание инструментов, но и стратегический взгляд и понимание потребностей бизнеса.🔜 Как подружить все эти вещи и внедрить BI в рабочие процессы рассказывает BI-эксперт Александр Бараков на ку…

1 month назад @ t.me
SQLite на практике SQLite на практике
последний пост 1 month назад
fuzzy: Нечеткое сравнение строк в SQLiteРасширение nalgeon/fuzzy помогает сравнивать строки на похожесть и транслитерировать текст.Одни функции считают расстояние между строками (чем оно больше, тем сильнее отличаются строки):-- Расстояние Дамерау-Левенште
fuzzy: Нечеткое сравнение строк в SQLiteРасширение nalgeon/fuzzy помогает сравнивать строки на похожесть и транслитерировать текст.Одни функции считают расстояние между строками (чем оно больше, тем сильнее отличаются строки):-- Расстояние Дамерау-Левенште

fuzzy: Нечеткое сравнение строк в SQLiteРасширение nalgeon/fuzzy помогает сравнивать строки на похожесть и транслитерировать текст.Одни функции считают расстояние между строками (чем оно больше, тем сильнее отличаются строки):-- Расстояние Дамерау-Левенштейнаselect fuzzy_damlev('awesome', 'aewsme');-- 2-- Расстояние Хэммингаselect fuzzy_hamming('awesome', 'aewsome');-- 2-- Расстояние Джаро-Винклераselect fuzzy_jarowin('awesome', 'aewsme');-- 0.907142857142857Другие функции рассчитывают фонетический код строки (помогает определять слова, которые похоже звучат):-- Caverphoneselect fuzzy_caver('awesome');-- AWSM111111select fuzzy_caver('owesome');-- AWSM111111-- Refined soundexselect fuzzy_rso…

1 month назад @ t.me
fileio: Работа с файлами в SQLiteРасширение nalgeon/fileio добавляет в SQLite возможность читать и писать файлы прямо из SQL.fileio_write записывает данные в файл:select fileio_write('hello.txt', 'hello world');fileio_read читает содержимое файла:select fi
fileio: Работа с файлами в SQLiteРасширение nalgeon/fileio добавляет в SQLite возможность читать и писать файлы прямо из SQL.fileio_write записывает данные в файл:select fileio_write('hello.txt', 'hello world');fileio_read читает содержимое файла:select fi

fileio: Работа с файлами в SQLiteРасширение nalgeon/fileio добавляет в SQLite возможность читать и писать файлы прямо из SQL.fileio_write записывает данные в файл:select fileio_write('hello.txt', 'hello world');fileio_read читает содержимое файла:select fileio_read('hello.txt');-- hello worldfileio_scan читает файл построчно, не загружая целиком в память:select rowid, value from fileio_scan('lines.txt');-- 1,one-- 2,two-- 3,threeКроме того, есть fileio_append (дописывает данные в файл) и функции для работы с каталогами — fileio_mkdir (создает каталог) и fileio_ls (читает содержимое каталога).Как установить расширение

1 month, 1 week назад @ t.me
define: Пользовательские функции в SQLiteКак известно, в SQLite нет хранимых процедур.Предполагается, что вместо них программист реализует нужные функции в своем коде (например, на Python) и зарегистрирует их в SQLite (так называемые application-defined fu
define: Пользовательские функции в SQLiteКак известно, в SQLite нет хранимых процедур.Предполагается, что вместо них программист реализует нужные функции в своем коде (например, на Python) и зарегистрирует их в SQLite (так называемые application-defined fu

define: Пользовательские функции в SQLiteКак известно, в SQLite нет хранимых процедур.Предполагается, что вместо них программист реализует нужные функции в своем коде (например, на Python) и зарегистрирует их в SQLite (так называемые application-defined functions).Но можно добавлять новые функции и прямо из SQL, если установить расширение nalgeon/define:-- Суммирует числа от 1 до nselect define('sumn', ':n * (:n + 1) / 2');select sumn(5);-- 15Еще пример:-- Генерит случайное число от 1 до ndefine('randint', ':a + abs(random()) % (:b - :a + 1)');select randint(10, 99);-- 67Расширение также включает функцию eval — можно динамически выполнять SQL из строки:-- Создаем и заполняем таблицуselect e…

1 month, 1 week назад @ t.me
crypto: Хеши, кодирование и декодирование в SQLiteОткрываю новую серию заметок. В каждом посте буду рассказывать об одном полезном расширении SQLite.Начнем с nalgeon/crypto. Оно предоставляет функции для расчета хешей, а также кодирования и декодирования д
crypto: Хеши, кодирование и декодирование в SQLiteОткрываю новую серию заметок. В каждом посте буду рассказывать об одном полезном расширении SQLite.Начнем с nalgeon/crypto. Оно предоставляет функции для расчета хешей, а также кодирования и декодирования д

crypto: Хеши, кодирование и декодирование в SQLiteОткрываю новую серию заметок. В каждом посте буду рассказывать об одном полезном расширении SQLite.Начнем с nalgeon/crypto. Оно предоставляет функции для расчета хешей, а также кодирования и декодирования данных.Хеши:select crypto_blake3('abc');select crypto_md5('abc');select crypto_sha1('abc');select crypto_sha256('abc'));-- и другиеКодирование/декодирование:Base32:select crypto_encode('hello', 'base32');-- NBSWY3DPselect crypto_decode('NBSWY3DP', 'base32');-- helloBase64:select crypto_encode('hello', 'base64');select crypto_decode('aGVsbG8=', 'base64');Hex:select crypto_encode('hello', 'hex');select crypto_decode('68656c6c6f', 'hex');Еще п…

1 month, 2 weeks назад @ t.me
Datalytics Datalytics
последний пост 5 days, 9 hours назад
У меня была нудная задача. Признаюсь, что я очень многие задачи считаю нудными по умолчанию. И я вынужден сам вдыхать в них какую-то творческую составляющую, чтобы они переставали быть такими нудными. В общем, я сам себе сначала рою яму отчаяния от того, ч
У меня была нудная задача. Признаюсь, что я очень многие задачи считаю нудными по умолчанию. И я вынужден сам вдыхать в них какую-то творческую составляющую, чтобы они переставали быть такими нудными. В общем, я сам себе сначала рою яму отчаяния от того, ч

У меня была нудная задача. Признаюсь, что я очень многие задачи считаю нудными по умолчанию. И я вынужден сам вдыхать в них какую-то творческую составляющую, чтобы они переставали быть такими нудными. В общем, я сам себе сначала рою яму отчаяния от того, что «боже мой какая же это скучная задача», а потом из этой ямы выкарабкиваюсь различными героическими и почти что поэтическими путямиЗадача моя состояла в том, чтобы сделать тренд-репорт о том, что вообще происходит с использованием ИИ в продуктах — какие тренды, нововведения. И я не хотел сознательно просто рассказывать про то, что появляются новые модели и т.д. и т.п. Также мне не хотелось делать компиляцию из уже известных тренд-репорто…

5 days, 9 hours назад @ t.me
🚀 Вы — аналитик или руководитель? Тогда вам знакома проблема целеполагания.Саша Мирской, директор аналитики вертикали Авито Товары, рассказывает, как правильно ставить цели менеджерам аналитики и на что на самом деле стоит тратить ресурсы.☄️ Почему руковод
🚀 Вы — аналитик или руководитель? Тогда вам знакома проблема целеполагания.Саша Мирской, директор аналитики вертикали Авито Товары, рассказывает, как правильно ставить цели менеджерам аналитики и на что на самом деле стоит тратить ресурсы.☄️ Почему руковод 🚀 Вы — аналитик или руководитель? Тогда вам знакома проблема целеполагания.Саша Мирской, директор аналитики вертикали Авито Товары, рассказывает, как правильно ставить цели менеджерам аналитики и на что на самом деле стоит тратить ресурсы.☄️ Почему руковод

🚀 Вы — аналитик или руководитель? Тогда вам знакома проблема целеполагания.Саша Мирской, директор аналитики вертикали Авито Товары, рассказывает, как правильно ставить цели менеджерам аналитики и на что на самом деле стоит тратить ресурсы.☄️ Почему руководителей аналитики невозможно адекватно оценить по старым схемам.☄️ Что такое «гигиенические проекты» и почему их стоит ограничивать.☄️ Как цели превращаются в карьерный рост, а не просто в отчет.💡 Не SMART-теория, а живой фреймворк с реальными примерами → смотрите новый впуск!

5 days, 14 hours назад @ t.me
⚡️Кто такие дата-инженеры и почему без них не обойтись современному бизнесу?Сейчас каждая компания собирает тонны данных: продажи, клиенты, маркетинг, логистика. Но сырые цифры бесполезны, если их нельзя превратить в понятные отчёты и выводы.Приглашаем вас
⚡️Кто такие дата-инженеры и почему без них не обойтись современному бизнесу?Сейчас каждая компания собирает тонны данных: продажи, клиенты, маркетинг, логистика. Но сырые цифры бесполезны, если их нельзя превратить в понятные отчёты и выводы.Приглашаем вас ⚡️Кто такие дата-инженеры и почему без них не обойтись современному бизнесу?Сейчас каждая компания собирает тонны данных: продажи, клиенты, маркетинг, логистика. Но сырые цифры бесполезны, если их нельзя превратить в понятные отчёты и выводы.Приглашаем вас

⚡️Кто такие дата-инженеры и почему без них не обойтись современному бизнесу?Сейчас каждая компания собирает тонны данных: продажи, клиенты, маркетинг, логистика. Но сырые цифры бесполезны, если их нельзя превратить в понятные отчёты и выводы.Приглашаем вас на вебинар 3 июня в 18:30 по МСК, где наш новый спикер — Владислав Вареник, Data Engineer в Сравни.ру — расскажет кто такие дата-инженеры и как они ускоряют работу бизнеса.Что вы узнаете на вебинаре?🟠Поговорим о профессии дата-инженера и почему эта профессия востребована.🟠Как устроен процесс работы с данными.🟠Как автоматизировать отчёты с помощью dbt и SQL.🟠Пример из реальной практики.Даже если вы далеки от аналитики — покажем, как начать…

2 weeks, 5 days назад @ t.me
За последние полгода на волне хайпа AI я видел, как команды пытаются внедрить AI-ассистентов в процессы BI, при этом не умея толком настроить отчётность. Покупают Tableau за миллионы, а потом год разбираются, почему метрики не сходятсяПроблема в том, что B
За последние полгода на волне хайпа AI я видел, как команды пытаются внедрить AI-ассистентов в процессы BI, при этом не умея толком настроить отчётность. Покупают Tableau за миллионы, а потом год разбираются, почему метрики не сходятсяПроблема в том, что B За последние полгода на волне хайпа AI я видел, как команды пытаются внедрить AI-ассистентов в процессы BI, при этом не умея толком настроить отчётность. Покупают Tableau за миллионы, а потом год разбираются, почему метрики не сходятсяПроблема в том, что B

За последние полгода на волне хайпа AI я видел, как команды пытаются внедрить AI-ассистентов в процессы BI, при этом не умея толком настроить отчётность. Покупают Tableau за миллионы, а потом год разбираются, почему метрики не сходятсяПроблема в том, что BI воспринимают как чисто «техническую задачу». Мол, наймём аналитиков, они всё настроят. А на деле это стратегический вопрос: как данные помогают принимать решения?Я давно слежу за тем, что делает Александр Бараков (автор канала data nature) — он один из немногих, кто понимает разницу между «сделать дашборд» и «выстроить data-driven культуру». И когда увидел, что он запускает курс по BI-стратегии, подумал — наконец-то кто-то будет учить не…

2 weeks, 6 days назад @ t.me
Эра скучных графиков окончена. Визуализация данных сделает любую информацию занятной и удобной для изучения, но в этой сфере не обойтись без проводника. Роман Бунин — эксперт в визуализации данных, развитии BI-систем и разработке дашбордов. Что всё это зна
Эра скучных графиков окончена. Визуализация данных сделает любую информацию занятной и удобной для изучения, но в этой сфере не обойтись без проводника. Роман Бунин — эксперт в визуализации данных, развитии BI-систем и разработке дашбордов. Что всё это зна Эра скучных графиков окончена. Визуализация данных сделает любую информацию занятной и удобной для изучения, но в этой сфере не обойтись без проводника. Роман Бунин — эксперт в визуализации данных, развитии BI-систем и разработке дашбордов. Что всё это зна

Эра скучных графиков окончена. Визуализация данных сделает любую информацию занятной и удобной для изучения, но в этой сфере не обойтись без проводника. Роман Бунин — эксперт в визуализации данных, развитии BI-систем и разработке дашбордов. Что всё это значит и как сделать первые шаги на поприще — читайте в карточках. А для полного погружения в тему Роман подготовил полезные ссылки:• Матрица компетенций для BI-аналитика с подробным гайдом• Список самых нужных книг по теме• Статья о разновидностях визуализации данных• Бесплатный курс по DataLens• Видео о визуализации собственных данных#Мнение

3 weeks, 3 days назад @ t.me
Полезная новость для всех, кто работает с аналитикой в DataLensТеперь вы можете подтвердить свои навыки официально и со скидкой 50%. Сертификация DataLens Analyst от Yandex Cloud помогает систематизировать знания и добавить весомый пункт в резюме.Программа
Полезная новость для всех, кто работает с аналитикой в DataLensТеперь вы можете подтвердить свои навыки официально и со скидкой 50%. Сертификация DataLens Analyst от Yandex Cloud помогает систематизировать знания и добавить весомый пункт в резюме.Программа Полезная новость для всех, кто работает с аналитикой в DataLensТеперь вы можете подтвердить свои навыки официально и со скидкой 50%. Сертификация DataLens Analyst от Yandex Cloud помогает систематизировать знания и добавить весомый пункт в резюме.Программа

Полезная новость для всех, кто работает с аналитикой в DataLensТеперь вы можете подтвердить свои навыки официально и со скидкой 50%. Сертификация DataLens Analyst от Yandex Cloud помогает систематизировать знания и добавить весомый пункт в резюме.Программа охватывает все, что важно для уверенной работы в BI и data-driven-командах:1) Вычисляемые поля и параметры2) Построение чартов и дашбордов3) Работа с датасетами и источниками данных4) Навигация и доступыНа сайте сертификации — бесплатный курс и все, что нужно для подготовки.🧠 Подходит специалистам по BI, аналитикам данных и тем, кто активно использует DataLens в повседневной работе.💸 До конца августа — цена прохождения экзамена снижена на…

3 weeks, 4 days назад @ t.me
🔥 Набор материалов, который нужен КАЖДОМУ АНАЛИТИКУ!Александр Нездемина выложил в свободный доступ разборы реальных собесов и задач + топовые шаблоны и чек-листы!👉 Скорее подписывайтесь, такое редко бывает бесплатно! Я уже скачал себе все материалы! ⚙️http
🔥 Набор материалов, который нужен КАЖДОМУ АНАЛИТИКУ!Александр Нездемина выложил в свободный доступ разборы реальных собесов и задач + топовые шаблоны и чек-листы!👉 Скорее подписывайтесь, такое редко бывает бесплатно! Я уже скачал себе все материалы! ⚙️http

🔥 Набор материалов, который нужен КАЖДОМУ АНАЛИТИКУ!Александр Нездемина выложил в свободный доступ разборы реальных собесов и задач + топовые шаблоны и чек-листы!👉 Скорее подписывайтесь, такое редко бывает бесплатно! Я уже скачал себе все материалы! ⚙️https://t.me/+hASxh8fnM49mMGJiErid: 2Vtzqx4vUd2 Реклама.ИП Пяташева Александра Витальевна ИНН 744518674547

1 month назад @ t.me
Лучше практики может быть только…еще больше практикиВ karpovꓸcourses это прекрасно понимают, поэтому не только предлагают большой объем практических задач в каждом курсе, но еще и разработали программы, полностью сфокусированные на практике, — симуляторы
Лучше практики может быть только…еще больше практикиВ karpovꓸcourses  это прекрасно понимают, поэтому не только предлагают большой объем практических задач в каждом курсе, но еще и разработали программы, полностью сфокусированные на практике, — симуляторы Лучше практики может быть только…еще больше практикиВ karpovꓸcourses это прекрасно понимают, поэтому не только предлагают большой объем практических задач в каждом курсе, но еще и разработали программы, полностью сфокусированные на практике, — симуляторы

Лучше практики может быть только…еще больше практикиВ karpovꓸcourses это прекрасно понимают, поэтому не только предлагают большой объем практических задач в каждом курсе, но еще и разработали программы, полностью сфокусированные на практике, — симуляторы для продвинутого изучения Data Science.К примеру, «Симулятор аналитика» позволит пройти полный цикл выстраивания аналитических процессов в компании под руководством ведущих экспертов сферы — и все это онлайн, в комфортном режиме, с возможностью совмещать обучение и жизнь. За 2 месяца вы погрузитесь в полноценный рабочий процесс, узнаете, с какими задачами ежедневно сталкиваются аналитики, и сами научитесь их решать.А если решитесь начать об…

1 month назад @ t.me
🔊 А вот и запись эфира, где аналитики Авито отвечали на вопросы. И тайм-коды для удобства:2:00 | Какие качества начинающего аналитика самые важные6:47 | Что мы сделали бы по-другому в рамках аналитики Авито 9:55 | Как в больших компаниях ловить баланс межд
🔊 А вот и запись эфира, где аналитики Авито отвечали на вопросы. И тайм-коды для удобства:2:00 | Какие качества начинающего аналитика самые важные6:47 | Что мы сделали бы по-другому в рамках аналитики Авито 9:55 | Как в больших компаниях ловить баланс межд 🔊 А вот и запись эфира, где аналитики Авито отвечали на вопросы. И тайм-коды для удобства:2:00 | Какие качества начинающего аналитика самые важные6:47 | Что мы сделали бы по-другому в рамках аналитики Авито 9:55 | Как в больших компаниях ловить баланс межд

🔊 А вот и запись эфира, где аналитики Авито отвечали на вопросы. И тайм-коды для удобства:2:00 | Какие качества начинающего аналитика самые важные6:47 | Что мы сделали бы по-другому в рамках аналитики Авито 9:55 | Как в больших компаниях ловить баланс между быть в теме важных нововведений/исследований и не захлебнуться от информации13:10 | Сложные вопросы и ответы про A/B-тесты 25:44 | Про Академию аналитиков Авито32:40 | Снова про hard-скилы аналитика и инструменты 36:44 | Как попасть в Академию аналитиков 40:34 | Где ищем интересные аналитические кейсы, которые затем применяем в работе44:10 | Про исследования ➡️ Больше контента от инженеров Авито смотрите на YouTube канале AvitoTech

1 month назад @ t.me
Чувствуешь, что не хватает знаний технички для уверенности на работе?Кажется, что перелопатила весь интернет, но так и не пришло понимания, а информация не сложилась в единый пазл? 🤔СТОП ❌Если тебе надоело:❌ бесконечно готовиться и заваливать техсобесы, ❌
Чувствуешь, что не хватает знаний технички для уверенности на работе?Кажется, что перелопатила весь интернет, но так и не пришло понимания, а информация не сложилась в единый пазл? 🤔СТОП ❌Если тебе надоело:❌ бесконечно готовиться и заваливать техсобесы, ❌ Чувствуешь, что не хватает знаний технички для уверенности на работе?Кажется, что перелопатила весь интернет, но так и не пришло понимания, а информация не сложилась в единый пазл? 🤔СТОП ❌Если тебе надоело:❌ бесконечно готовиться и заваливать техсобесы, ❌

Чувствуешь, что не хватает знаний технички для уверенности на работе?Кажется, что перелопатила весь интернет, но так и не пришло понимания, а информация не сложилась в единый пазл? 🤔СТОП ❌Если тебе надоело:❌ бесконечно готовиться и заваливать техсобесы, ❌ ощущать, что не хватает технических знаний, чтобы «соображать» в работе, ❌ не понимать терминологии и о чем идет речь на встречах команды, ❌ не понимать с какого края подступиться к решению рабочих задач, ❌ что не хватает структурности, системности и уверенности, то есть решение ✅ Канал Александра Нездемина, практикующего системного аналитика с 14летним опытом. В его канале ты найдешь емкие и структурные разборы задач из собесов, реальные …

1 month, 1 week назад @ t.me
⚡️Создаём свою нейросеть в PyTorchХотите быстро разобраться в PyTorch и написать свою нейросеть? Мы подготовили для вас вебинар, где на практике разберём все этапы создания ML-модели.Вебинар проведет Владислав Агафонов — ML-инженер, ранее работал в Yandex
⚡️Создаём свою нейросеть в PyTorchХотите быстро разобраться в PyTorch и написать свою нейросеть? Мы подготовили для вас вебинар, где на практике разберём все этапы создания ML-модели.Вебинар проведет Владислав Агафонов — ML-инженер, ранее работал в Yandex ⚡️Создаём свою нейросеть в PyTorchХотите быстро разобраться в PyTorch и написать свою нейросеть? Мы подготовили для вас вебинар, где на практике разберём все этапы создания ML-модели.Вебинар проведет Владислав Агафонов — ML-инженер, ранее работал в Yandex

⚡️Создаём свою нейросеть в PyTorchХотите быстро разобраться в PyTorch и написать свою нейросеть? Мы подготовили для вас вебинар, где на практике разберём все этапы создания ML-модели.Вебинар проведет Владислав Агафонов — ML-инженер, ранее работал в Yandex и Huawei.Что будет на вебинаре?🟠Установим PyTorch в Google Colab и настроим работу на бесплатном GPU;🟠Поймём, что такое тензоры и почему они — фундамент всех нейросетей;🟠Скачаем готовый датасет, разберём его структуру и подготовим для обучения;🟠Научимся использовать DataLoader для эффективной загрузки данных;🟠Пошагово соберём облегчённую версию классической свёрточной нейронной сети (CNN);🟠Обучим и протестируем модель.🕗 Встречаемся 14 мая …

1 month, 1 week назад @ t.me
Aha!25 — теперь два дня!29 и 30 мая в Москве пройдет Aha!25 — техническая конференция о product science, продуктовой аналитике и эффективности бизнеса. В этом году мы впервые расширяем программу до двух дней: 16 тематических потоков и более 1200 участников
Aha!25 — теперь два дня!29 и 30 мая в Москве пройдет Aha!25 — техническая конференция о product science, продуктовой аналитике и эффективности бизнеса. В этом году мы впервые расширяем программу до двух дней: 16 тематических потоков и более 1200 участников Aha!25 — теперь два дня!29 и 30 мая в Москве пройдет Aha!25 — техническая конференция о product science, продуктовой аналитике и эффективности бизнеса. В этом году мы впервые расширяем программу до двух дней: 16 тематических потоков и более 1200 участников

Aha!25 — теперь два дня!29 и 30 мая в Москве пройдет Aha!25 — техническая конференция о product science, продуктовой аналитике и эффективности бизнеса. В этом году мы впервые расширяем программу до двух дней: 16 тематических потоков и более 1200 участников на одной площадке.На сцене — топ-эксперты из Т-Банка, Яндекса, Авито, OZON, Альфа-Банка и других крупнейших компаний Рунета и СНГ: Виктор Кантор (MLinside), Кевин Ханда (Uzum), Сергей Веренцов (EORA), а также профессора и кандидаты наук из ИТМО, РЭШ, Центрального университета.По данным отраслевых отчётов, опросов и исследований, «экономика» — самый востребованный навык для развития среди продуктовых специалистов. Поэтому будем еще больше …

2 months назад @ t.me
⚡️ Разбираем тестовое задание в Т-Банк и строим дашборд в SuperSetРазборы тестовых заданий — это не просто полезно, а стратегически важно, если ты хочешь попасть в сильную компанию. Вы узнаете как технически выполнить задачу и научитесь превращать данные
⚡️ Разбираем тестовое задание в Т-Банк и строим дашборд в SuperSetРазборы тестовых заданий — это не просто полезно, а стратегически важно,  если ты хочешь попасть в сильную компанию. Вы узнаете как технически выполнить задачу и научитесь превращать данные ⚡️ Разбираем тестовое задание в Т-Банк и строим дашборд в SuperSetРазборы тестовых заданий — это не просто полезно, а стратегически важно, если ты хочешь попасть в сильную компанию. Вы узнаете как технически выполнить задачу и научитесь превращать данные

⚡️ Разбираем тестовое задание в Т-Банк и строим дашборд в SuperSetРазборы тестовых заданий — это не просто полезно, а стратегически важно, если ты хочешь попасть в сильную компанию. Вы узнаете как технически выполнить задачу и научитесь превращать данные в бизнес-инсайты, оформлять их убедительно и выделяться среди других соискателей.22 апреля в 18:30 по МСК проведем вебинар, где Денис Иванов разберет тестовое задание в Т-Банк и построит информативные визуализации в SuperSet. Денис — ведущий продуктовый аналитик.Что будем делать на вебинаре: 🟠 Разберем структуру тестового задания и обсудим, на что обращают внимание рекрутеры;🟠 Вместе решим задачи по SQL разной сложности;🟠 Покажем, как работ…

2 months назад @ t.me
Мы слишком много знаем!И просто обязаны этим поделиться. За 5 лет существования школы karpovꓸcourses мы обучили более 95 000 человек, и 80% наших выпускников уже работают в VK, Яндексе, Авито и других известных компаниях. И мы решили сделать для вас Karpov
Мы слишком много знаем!И просто обязаны этим поделиться. За 5 лет существования школы karpovꓸcourses мы обучили более 95 000 человек, и 80% наших выпускников уже работают в VK, Яндексе, Авито и других известных компаниях. И мы решили сделать для вас Karpov Мы слишком много знаем!И просто обязаны этим поделиться. За 5 лет существования школы karpovꓸcourses мы обучили более 95 000 человек, и 80% наших выпускников уже работают в VK, Яндексе, Авито и других известных компаниях. И мы решили сделать для вас Karpov

Мы слишком много знаем!И просто обязаны этим поделиться. За 5 лет существования школы karpovꓸcourses мы обучили более 95 000 человек, и 80% наших выпускников уже работают в VK, Яндексе, Авито и других известных компаниях. И мы решили сделать для вас Karpov.Conf — чтобы поделиться знаниями не только с нашими студентами, но и с каждым, кто интересуется аналитикой данных и другими направлениями Data Science.Будем обсуждать особенности работы с Power BI и практическое применение ML-моделей в крупных компаниях, разберем пользовательский опыт и реализацию аналитики на базе Yagpt, узнаем, как дерево метрик помогает принимать решения, и какие ошибки совершают крупные компании в контексте аналитики.…

2 months, 1 week назад @ t.me
⚡️Строим рекомендательную систему фильмов на KaggleВы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом
⚡️Строим рекомендательную систему фильмов на KaggleВы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом ⚡️Строим рекомендательную систему фильмов на KaggleВы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом

⚡️Строим рекомендательную систему фильмов на KaggleВы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом эфире покажет как построить рекомендательную систему фильмов на Kaggle. Что будем делать на вебинаре:🟠Разберем имеющиеся данные фильмов с их оценками🟠Проведем предобработку данных🟠Построим рекомендательную систему на основе машинного обучения🟠Проведем расчет и анализ метрик на основе результатов работы моделиВебинар будет интересен как новичкам, так и уже опытным специалистам😶Зарегистрироваться на бесплатный вебинар

2 months, 1 week назад @ t.me
Труба данных Труба данных
последний пост 3 days, 20 hours назад
Clickhouse 25.5https://clickhouse.com/blog/clickhouse-release-25-05@ohmydataengineer - канал "🕯Труба Данных"
Clickhouse 25.5https://clickhouse.com/blog/clickhouse-release-25-05@ohmydataengineer - канал "🕯Труба Данных" Clickhouse 25.5https://clickhouse.com/blog/clickhouse-release-25-05@ohmydataengineer - канал "🕯Труба Данных"

Clickhouse 25.5https://clickhouse.com/blog/clickhouse-release-25-05@ohmydataengineer - канал "🕯Труба Данных"

3 days, 20 hours назад @ t.me
Мои бывшие коллеги продолжают поставлять годный контент в пятничную рубрику!@ohmydataengineer - канал "🕯Труба Данных"
Мои бывшие коллеги продолжают поставлять годный контент в пятничную рубрику!@ohmydataengineer - канал "🕯Труба Данных" Мои бывшие коллеги продолжают поставлять годный контент в пятничную рубрику!@ohmydataengineer - канал "🕯Труба Данных"

Мои бывшие коллеги продолжают поставлять годный контент в пятничную рубрику!@ohmydataengineer - канал "🕯Труба Данных"

1 week, 2 days назад @ t.me
https://ducklake.selectDuckDB -> Duck Data Lake.Ну вы поняли. @ohmydataengineer - канал "🕯Труба Данных"
https://ducklake.selectDuckDB -> Duck Data Lake.Ну вы поняли. @ohmydataengineer - канал "🕯Труба Данных"

https://ducklake.selectDuckDB -> Duck Data Lake.Ну вы поняли. @ohmydataengineer - канал "🕯Труба Данных"

1 week, 4 days назад @ t.me
Максимальное спасибо @valiotti и @cyprusdata за организацию этого эвента!Если вы на Кипре и вы хотите быть в курсе дата-событий и понетворкаться и пообсуждать датку -> вступайте (через формочку) https://tally.so/r/nPpOEP
Максимальное спасибо @valiotti и @cyprusdata за организацию этого эвента!Если вы на Кипре и вы хотите быть в курсе дата-событий и понетворкаться и пообсуждать датку -> вступайте (через формочку) https://tally.so/r/nPpOEP

Максимальное спасибо @valiotti и @cyprusdata за организацию этого эвента!Если вы на Кипре и вы хотите быть в курсе дата-событий и понетворкаться и пообсуждать датку -> вступайте (через формочку) https://tally.so/r/nPpOEP

1 week, 5 days назад @ t.me
Редкое явление для нашего острова!Зато под одной крышей солидная кучка дата инженеров и дата аналитиков!
Редкое явление для нашего острова!Зато под одной крышей солидная кучка дата инженеров и дата аналитиков! Редкое явление для нашего острова!Зато под одной крышей солидная кучка дата инженеров и дата аналитиков!

Редкое явление для нашего острова!Зато под одной крышей солидная кучка дата инженеров и дата аналитиков!

1 week, 5 days назад @ t.me
Неделя или месяц покупок- Snowflake -> Crunchy Data https://techcrunch.com/2025/06/02/snowflake-to-acquire-database-startup-crunchy-data/ (видимо, чтобы сделать Snowflake Postgres)- Salesforce -> Informatica https://techcrunch.com/2025/05/27/salesfor
Неделя или месяц покупок- Snowflake -> Crunchy Data https://techcrunch.com/2025/06/02/snowflake-to-acquire-database-startup-crunchy-data/ (видимо, чтобы сделать Snowflake Postgres)- Salesforce -> Informatica https://techcrunch.com/2025/05/27/salesfor

Неделя или месяц покупок- Snowflake -> Crunchy Data https://techcrunch.com/2025/06/02/snowflake-to-acquire-database-startup-crunchy-data/ (видимо, чтобы сделать Snowflake Postgres)- Salesforce -> Informatica https://techcrunch.com/2025/05/27/salesforce-acquires-informatica-for-8-billion/ (оно еще живо и дергается на 8 миллиардов 🤪)- Alation -> Numbers Station https://techcrunch.com/2025/05/20/alation-acquires-numbers-station-to-bolster-its-ai-agent-offerings/ (шо-то модное для агентов)- ServiceNow -> Data.World https://techcrunch.com/2025/05/07/servicenow-acquires-data-world-two-months-after-acquiring-moveworks/ (кто-нибудь слышал про этот каталог и governance platform?)- Databricks -> Neon…

1 week, 6 days назад @ t.me
https://clickhouse.com/blog/clickstack-a-high-performance-oss-observability-stack-on-clickhouseТут Clickhouse аннонсировал опенсорсное (но платно тоже можно) решение для логов, метрик, трейсов - ClickStack@ohmydataengineer - канал "🕯Труба Данных"
https://clickhouse.com/blog/clickstack-a-high-performance-oss-observability-stack-on-clickhouseТут Clickhouse аннонсировал опенсорсное (но платно тоже можно) решение для логов, метрик, трейсов - ClickStack@ohmydataengineer - канал "🕯Труба Данных"

https://clickhouse.com/blog/clickstack-a-high-performance-oss-observability-stack-on-clickhouseТут Clickhouse аннонсировал опенсорсное (но платно тоже можно) решение для логов, метрик, трейсов - ClickStack@ohmydataengineer - канал "🕯Труба Данных"

2 weeks, 3 days назад @ t.me
Исследование специалистов по работе с данными — 2025DevCrowd запускает новый опрос для дата-инженеров, аналитиков, дата-сайентистов, ML-инженеров и их руководителей.Зачем участвовать?– чтобы понять, какие задачи и инструменты сейчас в тренде,– увидеть, как
Исследование специалистов по работе с данными — 2025DevCrowd запускает новый опрос для дата-инженеров, аналитиков, дата-сайентистов, ML-инженеров и их руководителей.Зачем участвовать?– чтобы понять, какие задачи и инструменты сейчас в тренде,– увидеть, как

Исследование специалистов по работе с данными — 2025DevCrowd запускает новый опрос для дата-инженеров, аналитиков, дата-сайентистов, ML-инженеров и их руководителей.Зачем участвовать?– чтобы понять, какие задачи и инструменты сейчас в тренде,– увидеть, как устроена работа у коллег в других продуктах,– узнать, как растут зарплаты и роли в индустрии,– получить данные, которые можно использовать для самодиагностики и карьерного планирования.🗂 Пример прошлогоднего исследования — https://devcrowd.ru/ds24📝 Опрос займёт 15 минут, результаты появятся в открытом доступе в августе.👉 Пройти опрос - https://survey.alchemer.eu/s3/90842227/data-2025@ohmydataengineer

2 weeks, 5 days назад @ t.me
Как всегда по пятница!@ohmydataengineer - канал "🕯Труба Данных"
Как всегда по пятница!@ohmydataengineer - канал "🕯Труба Данных" Как всегда по пятница!@ohmydataengineer - канал "🕯Труба Данных"

Как всегда по пятница!@ohmydataengineer - канал "🕯Труба Данных"

3 weeks, 2 days назад @ t.me
Comparing Analytics EnginesОчень интересный материал и хорошим сравнением нескольких аналитических движков. Редакция активно использует ClickHouse, но интересно было почитать и о других решениях. Очевидно, что универсального подхода к выбору лучшего движка
Comparing Analytics EnginesОчень интересный материал и хорошим сравнением нескольких аналитических движков. Редакция активно использует ClickHouse, но интересно было почитать и о других решениях. Очевидно, что универсального подхода к выбору лучшего движка

Comparing Analytics EnginesОчень интересный материал и хорошим сравнением нескольких аналитических движков. Редакция активно использует ClickHouse, но интересно было почитать и о других решениях. Очевидно, что универсального подхода к выбору лучшего движка для аналитических задач не существует, поэтому всегда полезно расширить кругозор.Авторы предлагаю следующую классификацию для OLAP DB: General Purpose Engines (Spark), Interactive SQL Engines (Presto, Trino), and Realtime OLAP Engines (ClickHouse, StarRocks)Кстати, StarRocks имеет на удивление самый высокий metascore. Spark - самый старый и в целом уже с legacy концепцией работы поверх map reduce - раза в 3 меньше по рейтингу, хотя он наи…

3 weeks, 4 days назад @ t.me
Интересных материалов нет, а интересные мемы - есть =)@ohmydataengineer - канал "🕯Труба Данных"
Интересных материалов нет, а интересные мемы - есть =)@ohmydataengineer - канал "🕯Труба Данных" Интересных материалов нет, а интересные мемы - есть =)@ohmydataengineer - канал "🕯Труба Данных"

Интересных материалов нет, а интересные мемы - есть =)@ohmydataengineer - канал "🕯Труба Данных"

1 month назад @ t.me
Разблокировалось тут забавное воспоминание!Cвою первую работу в айтишке (в Х5) я получил довольно забавно: случайно увидел пост от одного из хедов в фейсбуке, что ребята нанимают дата саентистов. Написал в личку "Я не DS, но умный и смышленый!".Мое резюме
Разблокировалось тут забавное воспоминание!Cвою первую работу в айтишке (в Х5) я получил довольно забавно: случайно увидел пост от одного из хедов в фейсбуке, что ребята нанимают дата саентистов. Написал в личку "Я не DS, но умный и смышленый!".Мое резюме Разблокировалось тут забавное воспоминание!Cвою первую работу в айтишке (в Х5) я получил довольно забавно: случайно увидел пост от одного из хедов в фейсбуке, что ребята нанимают дата саентистов. Написал в личку "Я не DS, но умный и смышленый!".Мое резюме

Разблокировалось тут забавное воспоминание!Cвою первую работу в айтишке (в Х5) я получил довольно забавно: случайно увидел пост от одного из хедов в фейсбуке, что ребята нанимают дата саентистов. Написал в личку "Я не DS, но умный и смышленый!".Мое резюме отправили руководителю разработки, который меня позвал на собес (тут я уже обрадовался от радости). А собес я провалил, знатно, причем вопросы были не алгоритмические упражнения с литкода, а вполне себе разработческие, например, чем отличается `git pull` от `git fetch`?Но мне дали второй шанс: тестовое домашнее задание. Нужно было написать сервис, который делает всякое разное с записями в базе данных. И я тут отыгрался: и докер контейнер с…

1 month назад @ t.me
https://www.cloudquery.io/blog/how-we-handle-billion-row-clickhouse-inserts-with-uuid-range-bucketingОчередная приятно-читаемая маготка про Clickhouse6 billion rows synced per monthData from 2,500 cloud accounts (1,900 AWS accounts + 600 Azure subscription
https://www.cloudquery.io/blog/how-we-handle-billion-row-clickhouse-inserts-with-uuid-range-bucketingОчередная приятно-читаемая маготка про Clickhouse6 billion rows synced per monthData from 2,500 cloud accounts (1,900 AWS accounts + 600 Azure subscription

https://www.cloudquery.io/blog/how-we-handle-billion-row-clickhouse-inserts-with-uuid-range-bucketingОчередная приятно-читаемая маготка про Clickhouse6 billion rows synced per monthData from 2,500 cloud accounts (1,900 AWS accounts + 600 Azure subscriptions)Configuration from 800+ Kubernetes clusters managing around 400,000 pods6-7 million rows of real-time data at any given moment4 TB of new data ingested monthly@ohmydataengineer - канал "🕯Труба Данных"

1 month, 1 week назад @ t.me
https://antirez.com/news/151Начиная с Redis 8, он снова open-source под AGPL, а не особо никем не признаваемой SSPL @ohmydataengineer - канал "🕯Труба Данных"
https://antirez.com/news/151Начиная с Redis 8, он снова open-source под AGPL, а не особо никем не признаваемой SSPL @ohmydataengineer - канал "🕯Труба Данных"

https://antirez.com/news/151Начиная с Redis 8, он снова open-source под AGPL, а не особо никем не признаваемой SSPL @ohmydataengineer - канал "🕯Труба Данных"

1 month, 2 weeks назад @ t.me
https://t.me/leftjoin_insider/317Вообще по пятницам я размещаю мемы, но сегодня, когда все внимание к каналу приковано, я сделаю исключение. Я не размещаю вакансии, почти не размещаю эвенты (за исключением моей любимой SmartData 👍) и курсы, но сегодня не с
https://t.me/leftjoin_insider/317Вообще по пятницам я размещаю мемы, но сегодня, когда все внимание к каналу приковано, я сделаю исключение. Я не размещаю вакансии, почти не размещаю эвенты (за исключением моей любимой SmartData 👍) и курсы, но сегодня не с

https://t.me/leftjoin_insider/317Вообще по пятницам я размещаю мемы, но сегодня, когда все внимание к каналу приковано, я сделаю исключение. Я не размещаю вакансии, почти не размещаю эвенты (за исключением моей любимой SmartData 👍) и курсы, но сегодня не смог отказать коллеге с острова с поиском.DE, Middle, ремоут пофиг где.Все по ссылке выше.За это злостное нарушение принципов я, возможно, получу, худи 😁

1 month, 3 weeks назад @ t.me
enthusiastech enthusiastech
последний пост None
data будни data будни
последний пост 4 months назад
🤑 yet another zarplatyклассный пример коллаборации: Саша Варламов собрал парсер и визуализациюhttps://t.me/data_bar/60а Никита это дело автоматизировал https://t.me/joni_in_web/21в результате получаем работающий проект и возможность посмотреть живую аналит
🤑 yet another zarplatyклассный пример коллаборации: Саша Варламов собрал парсер и визуализациюhttps://t.me/data_bar/60а Никита это дело автоматизировал https://t.me/joni_in_web/21в результате получаем работающий проект и возможность посмотреть живую аналит 🤑 yet another zarplatyклассный пример коллаборации: Саша Варламов собрал парсер и визуализациюhttps://t.me/data_bar/60а Никита это дело автоматизировал https://t.me/joni_in_web/21в результате получаем работающий проект и возможность посмотреть живую аналит

🤑 yet another zarplatyклассный пример коллаборации: Саша Варламов собрал парсер и визуализациюhttps://t.me/data_bar/60а Никита это дело автоматизировал https://t.me/joni_in_web/21в результате получаем работающий проект и возможность посмотреть живую аналитику зарплат — на скрин вынес кусочек деша с фильтром по аналитике.что мне нравится в подобных проектах: 1. проактивность — сам придумал, сам спроектировал, сам затащил, сам отчитался в блог 2. коллаборация — организоваться вдвоём гораздо сложнее, чем сделать одному, но эффект может быть круче 3. полезность, направленная наружу: когда решал свою задачу, а польза — всемв общем, смотрите деш и ставьте лайки Саше с Никитой)

4 months назад @ t.me
🦆 прилетят орлы и поднимут продкогда в работе встречаю какую-то проблему, то первым делом хочется написать в командный чатик, типа «ребята, там на дисках место заканчивается» со стороны это читается как «там на дисках место заканчивается … кто-нибудь сдела
🦆 прилетят орлы и поднимут продкогда в работе встречаю какую-то проблему, то первым делом хочется написать в командный чатик, типа «ребята, там на дисках место заканчивается» со стороны это читается как «там на дисках место заканчивается … кто-нибудь сдела

🦆 прилетят орлы и поднимут продкогда в работе встречаю какую-то проблему, то первым делом хочется написать в командный чатик, типа «ребята, там на дисках место заканчивается» со стороны это читается как «там на дисках место заканчивается … кто-нибудь сделайте что-нибудь!»получается, что я привлекаю внимание всех коллег к проблеме и тогда один из коллег (кстати, кто?) должен оторваться от своего текущего контекста и пойти расследовать эту проблему, потратить своё время и внимание, и найти причину и потенциальное решениено если я уже видел проблему, почему бы самому не посмотреть глубже, потратить какое-то время на расследование и прикинуть варианты решений. и в результате прийти в чатик уже …

4 months назад @ t.me
2/2в общем, много чего для нужд аналитики в удб уже есть, но чего там нет — надо додумывать самому)из озвученного — нет поддержки триггеров и хранимых процедур. плюс конечно как у любого нового инструмента нет такого богатого набора аддонов и инструментов
2/2в общем, много чего для нужд аналитики в удб уже есть, но чего там нет — надо додумывать самому)из озвученного — нет поддержки триггеров и хранимых процедур. плюс конечно как у любого нового инструмента нет такого богатого набора аддонов и инструментов

2/2в общем, много чего для нужд аналитики в удб уже есть, но чего там нет — надо додумывать самому)из озвученного — нет поддержки триггеров и хранимых процедур. плюс конечно как у любого нового инструмента нет такого богатого набора аддонов и инструментов как у того же постгреса, то же относиться и к коммьюнити.плюс в документации есть отдельная сноска чего пока нет в колоночных таблицах> В настоящий момент реализована не вся функциональность колоночных таблицhttps://ясубд.рф/docs/ru/concepts/datamodel/table.html#column-oriented-tables(надеюсь, документация просто чуток отстаёт от новых фич)⌘⌘⌘в теории звучит хорошо — один инструмент лучше, чем пять разных (при прочих равных)если задачи пос…

4 months назад @ t.me
📦 YDB + OLAP = ?ydb — это отлп-база данных от Яндекса. основная характеристика — нативная распределённость с поддержкой транзакции. из свойства распределённости следует высокая доступность и гибкая масштабируемость. помимо олтп-базы там есть ещё такая сущн
📦 YDB + OLAP = ?ydb — это отлп-база данных от Яндекса. основная характеристика — нативная распределённость с поддержкой транзакции. из свойства распределённости следует высокая доступность и гибкая масштабируемость. помимо олтп-базы там есть ещё такая сущн

📦 YDB + OLAP = ?ydb — это отлп-база данных от Яндекса. основная характеристика — нативная распределённость с поддержкой транзакции. из свойства распределённости следует высокая доступность и гибкая масштабируемость. помимо олтп-базы там есть ещё такая сущность как топики, с кафка-совместимым апи.и вот недавно ребята объявили, что ещё они идут в сторону олап-нагрузки. собирая эдакую всё-в-одном базу: с одной стороны у вас сервисы, с другой аналитика, а между ними нативный сдс-процесс, прямо не выходя из контура бд. https://yandex.cloud/ru/blog/posts/2024/12/ydb-dwh⌘⌘⌘интересно посмотреть со стороны аналитики и нашего двх-мира.→ очереди настраиваются через SQL-команды (кажется, в кликхаусе мо…

4 months назад @ t.me
🗿 подкасты про карьеру специально для постоянной читательницы этого блога — Натальи — ни к чему не обязывающая подборка подкастов на тему карьеры, её смены и всякого такого >_>подкасты хороши тем, что можно слушать на фоне, удобно чтобы ненапряжно на
🗿 подкасты про карьеру специально для постоянной читательницы этого блога — Натальи — ни к чему не обязывающая подборка подкастов на тему карьеры, её смены и всякого такого >_>подкасты хороши тем, что можно слушать на фоне, удобно чтобы ненапряжно на

🗿 подкасты про карьеру специально для постоянной читательницы этого блога — Натальи — ни к чему не обязывающая подборка подкастов на тему карьеры, её смены и всякого такого >_>подкасты хороши тем, что можно слушать на фоне, удобно чтобы ненапряжно набраться чужого опыта. пока остальные процессы ещё только готовятся или обдумываются⌘⌘⌘первым делом, конечно, стоит упомянуть про подкаст «собес» — в последнем сезоне они делают эпизоды в формате мок-собесов. это когда реальный рекрутер под реальную вакансию собесит кандидата прямо в эфире, а потом дают обратную связь и говорят что можно подкрутить. на своём опыте ощутил, что полезно послушать со стороны как звучит все эти привычные фразы и что и…

4 months, 1 week назад @ t.me
так! пора поговорить о действительно важных вещах, о которых почему-то все молчат — об оптимизации процесса загрузки посудомоечной машинычто же там оптимизировать, спросите вы? сейчас расскажу: ⁃ есть куча грязной посуды в раковине ⁃ надо её загрузить в п
так! пора поговорить о действительно важных вещах, о которых почему-то все молчат — об оптимизации процесса загрузки посудомоечной машинычто же там оптимизировать, спросите вы? сейчас расскажу: ⁃ есть куча грязной посуды в раковине ⁃ надо её загрузить в п

так! пора поговорить о действительно важных вещах, о которых почему-то все молчат — об оптимизации процесса загрузки посудомоечной машинычто же там оптимизировать, спросите вы? сейчас расскажу: ⁃ есть куча грязной посуды в раковине ⁃ надо её загрузить в посудомойку ⁃ чтобы всё влезло ⁃ и чтобы всё промылосьвот мы всё загрузили, оно помылось, настал финальный этап — разгрузка посуды и её раскладка по своим местам в ящиках и шкафах. и вот тут всплывает ещё одно — неявное — требование к процессу: упорядочивание. ведь (когда они не в мойке и не в раковине) вилки живут с вилками, ложки — с ложками; глубокие тарелки с одной стороны, отдельно от плоских. у кастрюль и плошек тоже есть свои места.и …

4 months, 2 weeks назад @ t.me
🏦 новый_план(2)_finalв 2021 у меня был план, который потом пришлось спешно править и вот спустя всего год снова пришлось пере-пере-придумывать план.в шведской Кларне нотис-период был два месяца, было время подумать-подготовиться. исходный план был максимал
🏦 новый_план(2)_finalв 2021 у меня был план, который потом пришлось спешно править и вот спустя всего год снова пришлось пере-пере-придумывать план.в шведской Кларне нотис-период был два месяца, было время подумать-подготовиться. исходный план был максимал

🏦 новый_план(2)_finalв 2021 у меня был план, который потом пришлось спешно править и вот спустя всего год снова пришлось пере-пере-придумывать план.в шведской Кларне нотис-период был два месяца, было время подумать-подготовиться. исходный план был максимальной широкий: «посмотреть всех» — включая иностранные компании.сперва готовился, искал зарубежом (чтобы работать из рф), но в итоге сузил поиск до стандартного варианта — находиться в Москве и работать на местную компанию.конечно, сразу в голове был вариант с Яндексом — благо для бывших сотрудников есть опция фаст-трека, и (ожидаемо) некоторое количество людей, готовых поработать вместе или же посоветовать таких.но я решил воспользоваться …

4 months, 3 weeks назад @ t.me
😭 как я не прошёл «собес» в ABBYсходил на подкаст к Кире Кузьменко, поговорили в формате мок-интервьюhttps://t.me/kirafound/1861ещё год назад я бы точно не рискнул публично собеситься — да ну его! но в последнее время стал спокойнее ко всему относиться: да
😭 как я не прошёл «собес» в ABBYсходил на подкаст к Кире Кузьменко, поговорили в формате мок-интервьюhttps://t.me/kirafound/1861ещё год назад я бы точно не рискнул публично собеситься — да ну его! но в последнее время стал спокойнее ко всему относиться: да

😭 как я не прошёл «собес» в ABBYсходил на подкаст к Кире Кузьменко, поговорили в формате мок-интервьюhttps://t.me/kirafound/1861ещё год назад я бы точно не рискнул публично собеситься — да ну его! но в последнее время стал спокойнее ко всему относиться: даже «отказ» это тоже новый опыт. тем более в этом случае была полезная обратная связь от Киры и Татьяны.было интересно поговорить и ещё более интересно узнать «как надо».→ главный вывод, который я для себя сделал — надо готовиться к собесам (ваш кэп!) и хотя бы гуглить непонятные слова из вакансии. по своим другим вакансиям я обычно знал ключевые технологии и их особенности, но конкретная эта вакансия была чуть в стороне: про обработку данн…

7 months, 1 week назад @ t.me
⚖️ собесы: дисбаланс за столомбывало на собесе сижу-пыхчу над задачкой, отбрасывая варианты один за другим, в итоге в муках порождаешь вроде-ничего-такое решение… только для того, чтобы интервьюер на той стороне нашёл там несколько критичных багов, и не ос
⚖️ собесы: дисбаланс за столомбывало на собесе сижу-пыхчу над задачкой, отбрасывая варианты один за другим, в итоге в муках порождаешь вроде-ничего-такое решение… только для того, чтобы интервьюер на той стороне нашёл там несколько критичных багов, и не ос

⚖️ собесы: дисбаланс за столомбывало на собесе сижу-пыхчу над задачкой, отбрасывая варианты один за другим, в итоге в муках порождаешь вроде-ничего-такое решение… только для того, чтобы интервьюер на той стороне нашёл там несколько критичных багов, и не особо запариваясь при этом. в такие моменты я чувствовал себя совсем тупым. ну или как минимум тупее интервьюера (а значит, тупее среднего сотрудника целевой компании!) 🤦‍♂️и хотя интервьюер действительно может быть умнее собеседуемого, в конечном итоге в этом вся идея: лиды собесят к себе в команду, синьоры собесят миддлов и т.д.; всё-таки не стоит забывать что человек на той стороне скорее всего проводит не первый собес, а значит уже набил…

7 months, 2 weeks назад @ t.me
🦖 как вытаскивали динозавра в опенсорскаджый яндексоид знаком с «ытём» — система хранения данных с sql-подобным доступом. я бы сказал, что YT находится в центре всех процессов яндекса, которые завязаны на анализ данных (это получается, практически всех?)(н
🦖 как вытаскивали динозавра в опенсорскаджый яндексоид знаком с «ытём» — система хранения данных с sql-подобным доступом. я бы сказал, что YT находится в центре всех процессов яндекса, которые завязаны на анализ данных (это получается, практически всех?)(н

🦖 как вытаскивали динозавра в опенсорскаджый яндексоид знаком с «ытём» — система хранения данных с sql-подобным доступом. я бы сказал, что YT находится в центре всех процессов яндекса, которые завязаны на анализ данных (это получается, практически всех?)(недавно осознал, насколько это внушительный буст для команды, когда у тебя по дефолту уже есть данные в нужном месте и доступная инфра, чтобы быстро начать ими пользоваться)а с не давних пор, посмотреть на этого дивного зверя могут все желающие — теперь YTsaurus доступен в опенсорс. ↓ доклад с прошлогоднего хайлоада с отчётом и рефлексией команды по итогам первой фазы этого эпического движа (да-да, с офф. релизом работа только началась))⌘ о…

7 months, 3 weeks назад @ t.me
🤑 как я искал валютную удалёнкукогда я понял (ещё будучи в Стокгольме), что где-то осенью уже точно буду менять работу, я начал прикидывать варианты.на тот момент (и с той стороны границы) самым выгодным казался вариант «валютной удалёнки»: когда платят в
🤑 как я искал валютную удалёнкукогда я понял (ещё будучи в Стокгольме), что где-то осенью уже точно буду менять работу, я начал прикидывать варианты.на тот момент (и с той стороны границы) самым выгодным казался вариант «валютной удалёнки»: когда платят в

🤑 как я искал валютную удалёнкукогда я понял (ещё будучи в Стокгольме), что где-то осенью уже точно буду менять работу, я начал прикидывать варианты.на тот момент (и с той стороны границы) самым выгодным казался вариант «валютной удалёнки»: когда платят в валюте европейского уровня зарплату, а я сам буду попивать смузи у себя в Москве. в уме я рисовал себе картину как буду получать на руки 5-7к долларов хе-хе-хеда, схема подразумевает, что у меня будет открыто грузинское или армянское ип, куда будут переводить оклад. насколько я понимаю налоги там что-то порядка 1% и открыть можно условно за несколько дней пребывания на месте. звучит несложно и вполне легально.⌘я начал искать вакансии, откл…

7 months, 3 weeks назад @ t.me
за время своей безработности я поговорил-познакомился с десятком компаний: посмотрел как там устроен процесс собесов, как общается команда на встречах, что за стэк используют и какие планы у команды.среди всех начатых процессов мне запоминалась команда Куп
за время своей безработности я поговорил-познакомился с десятком компаний: посмотрел как там устроен процесс собесов, как общается команда на встречах, что за стэк используют и какие планы у команды.среди всех начатых процессов мне запоминалась команда Куп

за время своей безработности я поговорил-познакомился с десятком компаний: посмотрел как там устроен процесс собесов, как общается команда на встречах, что за стэк используют и какие планы у команды.среди всех начатых процессов мне запоминалась команда Купера (они же Sbermarket до июня 2024, а ещё раньше это был Instamart)начнём с того, что это был самый быстрый процесс: обратная связь после каждой встречи буквально на следующий день и минимальный интервал между встречами. можно считать, что зачёт на отсутствие бюрократии получен «автоматом».сам процесс был тоже без лишних этапов — быстрый скрининг и две секции: поговорить по душам за технику и потом за твой опыт и мотивациюв целом осталось…

7 months, 3 weeks назад @ t.me
🤓 подгтовка к собесам: список техвопросов в мой прошлый заход по поиску работы я исходил из довольно наивного подхода: вот я такой красивый работу работаю, по пути что-то узнаю новое, вот это и буду отвечать на собесах! если чего-то не знаю, то так тому и
🤓 подгтовка к собесам: список техвопросов в мой прошлый заход по поиску работы я исходил из довольно наивного подхода: вот я такой красивый работу работаю, по пути что-то узнаю новое, вот это и буду отвечать на собесах! если чего-то не знаю, то так тому и

🤓 подгтовка к собесам: список техвопросов в мой прошлый заход по поиску работы я исходил из довольно наивного подхода: вот я такой красивый работу работаю, по пути что-то узнаю новое, вот это и буду отвечать на собесах! если чего-то не знаю, то так тому и быть; типа за два часа не стану профи во всех вопросах.в итоге на интервью на вопрос «какую базу выберешь под задачу» отвечал «хехехе, постгрес!». и хотя по всё нарастающей универсальности последнего ещё можно было бы дожать ответ, если бы я был наглее и увереннее; но по факту интервьюеры прекрасно понимали по ответу, что других баз я просто не в курсе.в этот раз я решил подготовиться заранее: сделать список потенциальных тем, которые обыч…

7 months, 3 weeks назад @ t.me
👋 Саша Михайлов, безработныйпочти год назад я писал, как устроился в шведский финтех Klarna и уехал жить в Стокгольм. Раз уж написал начало истории, напишу и её окончание 😭что же случилось? не прошел перфоманс ревью? очередные лейоффы? Кларна закрылась? вс
👋 Саша Михайлов, безработныйпочти год назад я писал, как устроился в шведский финтех Klarna и уехал жить в Стокгольм. Раз уж написал начало истории, напишу и её окончание 😭что же случилось? не прошел перфоманс ревью? очередные лейоффы? Кларна закрылась? вс

👋 Саша Михайлов, безработныйпочти год назад я писал, как устроился в шведский финтех Klarna и уехал жить в Стокгольм. Раз уж написал начало истории, напишу и её окончание 😭что же случилось? не прошел перфоманс ревью? очередные лейоффы? Кларна закрылась? всё гораздо проще: семья не прижилась в новой стране и мы решили вернуться назадне зря говорят, что основная сложность при эмиграции приходится именно на плюсодинов. В отличие от супруги, у меня был и клёвый офис, куда можно было ходить, и живые люди с кем можно было пообщаться за жизнь; поэтому мне было гораздо проще адаптироваться и в целом я чувствовал себя на своём месте.в итоге семья уехала «на лето к бабушкам на родину», откуда потом р…

8 months, 1 week назад @ t.me
под капотом Яндекс.Такси под капотом Яндекс.Такси
последний пост None
🎧 Podcasts
Data Engineering Podcast Data Engineering Podcast
последний пост None
Data Brew by Databricks
последний пост 1 month, 4 weeks назад
Benchmarking Domain Intelligence | |E45
Benchmarking Domain Intelligence | |E45 Benchmarking Domain Intelligence | |E45

In this episode, Pallavi Koppol, Research Scientist at Databricks, explores the importance of domain-specific intelligence in large language models (LLMs). She discusses how enterprises need models tailored to their unique jargon, data, and tasks rather than relying solely on general benchmarks. Highlights include: - Why benchmarking LLMs for domain-specific tasks is critical for enterprise AI. - An introduction to the Databricks Intelligence Benchmarking Suite (DIBS). - Evaluating models on...

1 month, 4 weeks назад @ buzzsprout.com
SWE-bench & SWE-agent | |E44
SWE-bench & SWE-agent | |E44 SWE-bench & SWE-agent | |E44

In this episode, Kilian Lieret, Research Software Engineer, and Carlos Jimenez, Computer Science PhD Candidate at Princeton University, discuss SWE-bench and SWE-agent, two groundbreaking tools for evaluating and enhancing AI in software engineering. Highlights include: - SWE-bench: A benchmark for assessing AI models on real-world coding tasks. - Addressing data leakage concerns in GitHub-sourced benchmarks. - SWE-agent: An AI-driven system for navigating and solving coding challenges. - Ov...

2 months назад @ buzzsprout.com
Enterprise AI: Research to Product | |E43
Enterprise AI: Research to Product | |E43 Enterprise AI: Research to Product | |E43

In this episode, Dipendra Kumar, Staff Research Scientist, and Alnur Ali, Staff Software Engineer at Databricks, discuss the challenges of applying AI in enterprise environments and the tools being developed to bridge the gap between research and real-world deployment. Highlights include: - The challenges of real-world AI—messy data, security, and scalability. - Why enterprises need high-accuracy, fine-tuned models over generic AI APIs. - How QuickFix learns from user edits to improve AI-dri...

2 months, 1 week назад @ buzzsprout.com
Multimodal AI | |E42
Multimodal AI | |E42 Multimodal AI | |E42

In this episode, Chang She, CEO and Co-founder of LanceDB, discusses the challenges of handling multimodal data and how LanceDB provides a cutting-edge solution. He shares his journey from contributing to Pandas to building a database optimized for images, video, vectors, and subtitles. Highlights include: - The limitations of traditional storage systems like Parquet for multimodal AI. - How LanceDB enables efficient querying and processing of diverse data types. - The growing importance of ...

2 months, 2 weeks назад @ buzzsprout.com
Age of Agents | |E41
Age of Agents | |E41 Age of Agents | |E41

In this episode, Michele Catasta, President of Replit, explores how AI-driven agents are transforming software development by making coding more accessible and automating application creation. Highlights include: - The difference between AI agents and copilots in software development. - How AI is democratizing coding, enabling non-programmers to build applications. - Challenges in AI agent development, including error handling and software quality. - The growing role of AI in entrepreneurshi...

2 months, 3 weeks назад @ buzzsprout.com
Reward Models | |E40
Reward Models | |E40 Reward Models | |E40

In this episode, Brandon Cui, Research Scientist at MosaicML and Databricks, dives into cutting-edge advancements in AI model optimization, focusing on Reward Models and Reinforcement Learning from Human Feedback (RLHF). Highlights include: - How synthetic data and RLHF enable fine-tuning models to generate preferred outcomes. - Techniques like Policy Proximal Optimization (PPO) and Direct Preference Optimization (DPO) for enhancing response quality. - The role of reward models in improving ...

3 months назад @ buzzsprout.com
Retrieval, rerankers, and RAG tips and tricks | |E39
Retrieval, rerankers, and RAG tips and tricks | |E39 Retrieval, rerankers, and RAG tips and tricks | |E39

In this episode, Andrew Drozdov, Research Scientist at Databricks, explores how Retrieval Augmented Generation (RAG) enhances AI models by integrating retrieval capabilities for improved response accuracy and relevance. Highlights include: - Addressing LLM limitations by injecting relevant external information. - Optimizing document chunking, embedding, and query generation for RAG. - Improving retrieval systems with embeddings and fine-tuning techniques. - Enhancing search results using re-...

4 months назад @ buzzsprout.com
The Power of Synthetic Data | |E38
The Power of Synthetic Data | |E38 The Power of Synthetic Data | |E38

In this episode, Yev Meyer, Chief Scientist at Gretel AI, explores how synthetic data transforms AI and ML by improving data access, quality, privacy, and model training. Highlights include: - Leveraging synthetic data to overcome AI data limitations. - Enhancing model training while mitigating ethical and privacy risks. - Exploring the intersection of computational neuroscience and AI workflows. - Addressing licensing and legal considerations in synthetic data usage. - Unlocking private dat...

4 months, 2 weeks назад @ buzzsprout.com
Secret to Production AI: Tools & Infrastructure | |E37
Secret to Production AI: Tools & Infrastructure | |E37 Secret to Production AI: Tools & Infrastructure | |E37

In this episode, Julia Neagu, CEO & co-founder of Quotient AI, explores the challenges of deploying Generative AI and LLMs, focusing on model evaluation, human-in-the-loop systems, and iterative development.Highlights include:- Merging reinforcement learning and unsupervised learning for real-time AI optimization.- Reducing bias in machine learning with fairness and ethical considerations.- Lessons from large-scale AI deployments on scalability and feedback loops.- Automating workflows wi...

5 months назад @ buzzsprout.com
Mixture of Memory Experts (MoME) | |E36
Mixture of Memory Experts (MoME) | |E36 Mixture of Memory Experts (MoME) | |E36

In this episode, Sharon Zhou, Co-Founder and CEO of Lamini AI, shares her expertise in the world of AI, focusing on fine-tuning models for improved performance and reliability.Highlights include:- The integration of determinism and probabilism for handling unstructured data and user queries effectively.- Proprietary techniques like memory tuning and robust evaluation frameworks to mitigate model inaccuracies and hallucinations.- Lessons learned from deploying AI applications, including insigh...

5 months, 1 week назад @ buzzsprout.com
Mixed Attention | |E34
Mixed Attention | |E34 Mixed Attention | |E34

In this episode, Shashank Rajput, Research Scientist at Mosaic and Databricks, explores innovative approaches in large language models (LLMs), with a focus on Retrieval Augmented Generation (RAG) and its impact on improving efficiency and reducing operational costs.Highlights include:- How RAG enhances LLM accuracy by incorporating relevant external documents.- The evolution of attention mechanisms, including mixed attention strategies.- Practical applications of Mamba architectures and their...

7 months назад @ buzzsprout.com
Kumo AI & Relational Deep Learning | |E34
Kumo AI & Relational Deep Learning | |E34 Kumo AI & Relational Deep Learning | |E34

In this episode, Jure Leskovec, Co-founder of Kumo AI and Professor of Comuter Science at Stanford University, discusses Relational Deep Learning (RDL) and its role in automating feature engineering. Highlights include:- How RDL enhances predictive modeling.- Applications in fraud detection and recommendation systems.- The use of graph neural networks to simplify complex data structures.

8 months, 1 week назад @ buzzsprout.com
«Ничего такого» by Dodo Enginnering
последний пост None
Запуск завтра Podcast Запуск завтра Podcast
последний пост 2 weeks, 5 days назад
Опрос слушателей по итогам 12 сезона
Опрос слушателей по итогам 12 сезона

Недавно мы закончили уже 12-й сезон «Запуска завтра», и, как обычно, хотим узнать, что вы думаете о нем и о подкасте в целом — что вам нравится, что не нравится и какие эпизоды вы бы хотели услышать в новом сезоне. Мы сделали небольшой опрос и просим вас его пройти, это займет 5-7 минут и поможет сделать подкаст еще лучше. Проходите опрос по ссылке: https://form.typeform.com/to/ACkYIF0TСпасибо вам и до встречи в новом сезоне!

2 weeks, 5 days назад @ share.transistor.fm
Космос. Как стартапы вышли на орбиту
Космос. Как стартапы вышли на орбиту Космос. Как стартапы вышли на орбиту

Частные ракеты, выводящие в космос тысячи спутников, многоразовые корабли, журналисты и звезды голливуда на орбите Земли… Космическая индустрия последние десятилетия развивается так стремительно, что не за всеми ее прорывами успеваешь следить. Многие из этих достижений стали возможны благодаря частным компаниям, ворвавшимся в космическое пространство. В эпизоде разбираемся, как в космос пришло стартап-мышление и к чему это приводит.Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Selectel — база для развития любого современного бизнеса. Создавайте и масштабируйте проекты на IT-инфраструктуре Selectel: https://slc.tl/rolvv?erid=2SDnjf2MjAd ***Разработка сайтов и мобильных приложений от Самата: https://…

1 month назад @ share.transistor.fm
Роботы. Чему мы смогли их научить за последние 100 лет
Роботы. Чему мы смогли их научить за последние 100 лет Роботы. Чему мы смогли их научить за последние 100 лет

Железная рука, собирающая новое авто на конвейере; андроид, сортирующий коробки на складе; дружелюбный экран для общения и даже секс-кукла под управлением ChatGPT — все это достижения робототехники. Когда-то роботы были железными, неповоротливыми и подчинялись алгоритмам. Сегодня мы хотим сделать их гибкими, мягкими и эмпатичными. В этом выпуске наблюдаем, как эволюционировали роботы — от игрушек-автоматонов 18 века до умных машин на пути к координации, ощущениям, выражению эмоций и другим человеческим качествам. ***Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Кейс с RPA-платформой и с тысячами одновременно работающих голосовых роботов: https://slc.tl/0c7d0 Selectel — база для развития любого совр…

1 month, 1 week назад @ share.transistor.fm
Искусственный интеллект. Могут ли машины мыслить как люди?
Искусственный интеллект. Могут ли машины мыслить как люди? Искусственный интеллект. Могут ли машины мыслить как люди?

Умение играть в шахматы, доказывать теоремы, видеть образы на картинах и самим их создавать, писать тексты и общаться на естественном языке - долгое время мы считали, что так умеет только человек благодаря интеллекту. Однако, сегодня нейросети и языковые модели тоже умеют все это, но о разумности машин речи по-прежнему не идет. Тогда что такое искусственный интеллект, если не набор умений, похожих на человеческие? В этом выпуске разбираемся, как инженеры и философы больше века пытаются создать мыслящую машину и каждый раз добиваются лишь имитации разума.***Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Selectel — база для развития любого современного бизнеса. Создавайте и масштабируйте проекты на IT…

1 month, 2 weeks назад @ share.transistor.fm
Электромобили. Что мешает электродвигателям изменить мир
Электромобили. Что мешает электродвигателям изменить мир Электромобили. Что мешает электродвигателям изменить мир

В начале прошлого века электроавтомобили конкурировали с бензиновыми на равных, но затем почти сошли со сцены. Все из-за врожденных проблем электродвигателя, над которыми инженеры бьются больше столетия. В этом выпуске разбираемся, какой путь прошли электроавто, как это связано с прогрессом технологии аккумуляторов, какую революцию совершила корпорация Tesla и почему даже ей не удалось посадить нас всех на электрические автомобили.***Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Selectel — база для развития любого современного бизнеса. Создавайте и масштабируйте проекты на IT-инфраструктуре Selectel: https://slc.tl/y9vpu?erid=2SDnjeZjvkd***Слушайте бонусные эпизоды «Запуска завтра» и других подкаст…

2 months назад @ share.transistor.fm
Криптовалюта. Можно ли построить финансовую систему без доверия и посредников
Криптовалюта. Можно ли построить финансовую систему без доверия и посредников

Что если деньги — это не только бумага и цифры, а прежде всего доверие? А если доверие можно зашить в код — зачем нам тогда банки и государства? Этот выпуск — история о том, как кризис 2008 года дал толчок поиску альтернативных денег, а вместе с ним — целой идеологии децентрализации финансовой системы. Мы проследим путь криптовалют от идей энтузиастов до мировых финансовых рынков и попробуем понять: действительно ли перед нами — будущее денег, или всего лишь неудачный эксперимент?***Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Selectel — база для развития любого современного бизнеса. Создавайте и масштабируйте проекты на IT-инфраструктуре Selectel: https://slc.tl/c0uf3?erid=2SDnjdWbmPz ***Новый ку…

2 months, 1 week назад @ share.transistor.fm
Заменит ли ИИ программистов?
Заменит ли ИИ программистов?

Самат Галимов и Егор Хмелев — два технических директора. У них в компаниях работают десятки людей, чья основная работа — писать код. При этом многие адепты ИИ убеждены, что совсем скоро с этой задачей будет лучше справляться машина. В этом эпизоде Самат и Егор обсуждают, как применять ИИ в работе и не облажаться, что такое «вайб-кодинг» и каким они видят будущее профессии программиста.6+. Реклама. АО «ПФ «СКБ Контур». ОГРН 1026605606620. 620144, Екатеринбург, ул. Народной Воли, 19А. erid: 2SDnjdkRA4cКонтур — эко-система продуктов для бизнеса. О работе в компании: https://kontur.ru/s/a2os66jkПодкаст «Никакого правильно»: https://pc.st/1488479498Эпизод про микробиом: https://pc.st/e/6U9su2556…

2 months, 3 weeks назад @ share.transistor.fm
Власть над вниманием. Как нами управляют в цифровой среде
Власть над вниманием. Как нами управляют в цифровой среде

Почему так сложно перестать листать шортсы? Соцсети и сервисы управляют вниманием пользователей и таким образом удерживают их на платформах. За счет чего это получается? Самат Галимов говорит о закономерностях работы психики и разбирает примеры из пользовательского опыта с Еленой Горбуновой — исследовательницей цифровых интерфейсов.6+. Реклама. АО «ПФ «СКБ Контур». ОГРН 1026605606620. 620144, Екатеринбург, ул. Народной Воли, 19А. erid: 2SDnjdjAFoSКонтур — эко-система продуктов для бизнеса. О работе в компании: https://kontur.ru/s/a2os66jkМатериалы, которые мы упоминали в эпизоде: Телеграм-канал HSE UX LAB: https://t.me/hse_ux_lab Видео с невидимой гориллой: https://clck.ru/3Hunwr Подкаст «С…

3 months назад @ share.transistor.fm
Наши устройства способны на большее? Говорим о программных ограничениях
Наши устройства способны на большее? Говорим о программных ограничениях

Функции одного и того же устройства меняются в зависимости от того, в каких условиях его используют. Так происходит из-за программных ограничений. Откуда они берутся? На что распространяются? И как пользователям не позволить себя обмануть? Самат Галимов разбирается в этих вопросах вместе с редакторкой подкаста Машей Агличевой.6+. Реклама. АО «ПФ «СКБ Контур». ОГРН 1026605606620. 620144, Екатеринбург, ул. Народной Воли, 19А. erid: 2SDnjeLHht8 Контур — эко-система продуктов для бизнеса. О работе в компании: https://kontur.ru/s/a2os66jkПодкаст «Почему мы еще живы»: https://pc.st/1568720773Слушайте бонусные эпизоды «Запуск++», а еще другие бонусы студии «Либо/Либо» по подписке ЛибоЛибо+ в Apple…

3 months, 1 week назад @ share.transistor.fm
Интероперабельность. Как подружить сервисы между собой
Интероперабельность. Как подружить сервисы между собой

Устройства и программы, которыми мы пользуемся, умеют намного больше, чем мы можем себе представить. В США и других странах активисты борются за то, чтобы технологии были более совместимыми, а производители давали покупателям больше свободы решать, как пользоваться их продуктами. Почему это важно и какие крутые возможности появятся в интероперабельном будущем? Обсуждаем с активистом в сфере цифровых прав Кори Доктороу. 6+. Реклама. АО «ПФ «СКБ Контур». ОГРН 1026605606620. 620144, Екатеринбург, ул. Народной Воли, 19А. erid: 2SDnjdDJ444Контур — экосистема продуктов для бизнеса. О работе в компании: https://kontur.ru/s/a2os66jk Полная версию разговора на английском языке доступна по подписке. …

3 months, 2 weeks назад @ share.transistor.fm
Как россияне остались без YouTube
Как россияне остались без YouTube

Еще несколько месяцев назад YouTube смотрели около 100 миллионов россиян. В июле пользователи начали жаловаться на медленную загрузку видео, сейчас их вообще не получается запустить. Как блокировка такого популярного сервиса стала возможна? И что значил YouTube для россиян? Самат Галимов говорит с исследовательницей интернета Полиной Колозариди и одним из ведущих специалистов по блокировкам в рунете Филиппом Кулиным.Сайт проекта «Эшер II»: https://usher2.club/ Телеграм-канал «Эшер II A+»: https://t.me/usher2«Эшер II». Рассказ из книги Рея Брэдбери «Марсианские хроники»: https://usher2.club/usher2 Ссылка на бесплатный VPN-сервис: https://vpngen.org/ Подкаст «Закат империи»: https://pc.st/149…

3 months, 3 weeks назад @ share.transistor.fm
GDPR. Как устроена защита персональных данных
GDPR. Как устроена защита персональных данных

GDPR — это регламент Евросоюза о персональных данных, изменивший цифровое пространство во всем мире. Из-за него компании могут собирать данные о пользователях только по определенному алгоритму, а люди — влиять на то, какой информацией делятся. По каким правилам собирают наши данные? Кто их придумал? И как обезопасить себя? Самат Галимов говорит с Сергеем Сайгановым — сооснователем юридической фирмы Comply.6+. Реклама. АО «ПФ «СКБ Контур». ОГРН 1026605606620. 620144, Екатеринбург, ул. Народной Воли, 19А. erid: 2SDnjchXZZvКонтур — IT-разработчик продуктовой экосистемы для бизнеса. О работе в компании: https://kontur.ru/s/a2os66jkПоддержите студию подкастов «Либо/Либо», которая выпускает этот …

4 months назад @ share.transistor.fm
Как работает спутниковый интернет
Как работает спутниковый интернет

Спутники в космосе надежнее, чем кабели на дне океана? Можно ли заблокировать спутниковый интернет? Как Starlink вырвался вперед на рынке? В этом эпизоде разбираемся, как устроен и как регулируется спутниковый интернет. Гости эпизода — киберадвокат и основатель общественной организации «Роскомсвобода» Саркис Дарбинян и популяризатор космонавтики Виталий Егоров.6+. Реклама. АО «ПФ «СКБ Контур». ОГРН 1026605606620. 620144, Екатеринбург, ул. Народной Воли, 19А. erid: 2SDnjeLHht8Контур — IT-разработчик продуктовой экосистемы для бизнеса. О работе в компании: https://kontur.ru/s/a2os66jkБлог Виталия: https://www.youtube.com/@egorovkot Подкаст «На каком основании»: https://pc.st/1735291623Выпуск …

4 months, 1 week назад @ share.transistor.fm
Что означает появление DeepSeek
Что означает появление DeepSeek

На рынке искусственного интеллекта появился новый игрок. Китайская нейросеть DeepSeek сравнима по качеству с моделями OpenAI, Anthropic и Google, но на ее разработку потратили в десятки раз меньше. Вместе с Артемом Родичевым из стартапа Ex-Human разбираемся, как у DeepSeek это получилось, что это значит для лидеров индустрии и как отразится на обычных пользователях.6+. Реклама. АО «ПФ «СКБ Контур». ОГРН 1026605606620. 620144, Екатеринбург, ул. Народной Воли, 19А. erid: 2SDnjeQu4bvКонтур — IT-разработчик продуктовой экосистемы для бизнеса. О работе в компании: https://kontur.ru/s/a2os66jkСсылка на курс студии «Либо/Либо» по подкастам: https://course.libolibo.me/ Выпуск с участием Артема про …

4 months, 2 weeks назад @ share.transistor.fm
Как приложения оказываются на наших устройствах
Как приложения оказываются на наших устройствах

Купить телефон с хорошим дизайном или возможностью скачать приложение банка? Это выбор, перед которым оказываются пользователи и у которого нет технических причин. Как приложения попадают в AppStore? Что свободнее: телефоны или компьютеры? И кто решает, как пользователям распоряжаться своими устройствами? Самат Галимов ищет ответы вместе с редакторкой подкаста Машей Агличевой.6+. Реклама. АО «ПФ «СКБ Контур». ОГРН 1026605606620. 620144, Екатеринбург, ул. Народной Воли, 19А. erid: 2SDnjbt4aGLКонтур — IT-разработчик продуктовой экосистемы для бизнеса. О работе в компании: https://kontur.ru/s/a2os66jkПодкаст «Это непросто»: https://pc.st/1437512522 Выпуск «Это непросто» про лимонады lapochka: …

4 months, 3 weeks назад @ share.transistor.fm
Moscow Python Podcast Moscow Python Podcast
последний пост 2 weeks назад
Новости мира Python за мая 2025
Новости мира Python за мая 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MWZEX Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Microsoft дропнула спонсорскую поддержку Faster CPython project и уволила большую часть команды — https://discuss.python.org/t/community-stewardship-of-faster-cpython/92153/10;

Python 3.14 Beta — https://pythoninsider.blogspot.com/2025/05/python-3140-beta-1-is-here.html;

The first year of free-threaded Python — https://labs.quansight.org/blog/free-threaded-one-year-recap;

Тайпчекеры — https://engineering.fb.com/2025/05/15/developer-tools/introducing-pyrefly-a-new-type-checker-and-ide-experience-f…

2 weeks назад @ learnpython.podbean.com
Day Special: dependency injection в Python
Day Special: dependency injection в Python

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm

Ведущие – Григорий Петров и Никита Соболев Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf

1 month, 1 week назад @ learnpython.podbean.com
Day Special: асинхронность
Day Special: асинхронность

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm Ведущие – Григорий Петров и Никита Соболев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

1 month, 2 weeks назад @ learnpython.podbean.com
Новости мира Python за апрель 2025
Новости мира Python за апрель 2025

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: В Python закончили затаскивать криптографию из HACL* — https://jonathan.protzenko.fr/2025/04/18/python.html

Релиз Pydantic v2.11 — https://pydantic.dev/articles/pydantic-v2-11-release

Dependency groups и экспериментальная поддержка pylock.toml в pip — https://ichard26.github.io/blog/2025/04/whats-new-in-pip-25.1/ Приняли PEP 768 – Safe external debugger interface for CPython — https://peps.python.org/pep-0768/

Приняли PEP 750 – Template Strings — https://peps.python.org/pep-0750/ Отклонили PEP 736 – Shorthand syntax for keyword arguments at invocation — https://peps.pyt…

1 month, 2 weeks назад @ learnpython.podbean.com
Day Special: типизация в Python или mypy, Any и дженерики под микроскопом
Day Special: типизация в Python или mypy, Any и дженерики под микроскопом

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm Ведущие – Григорий Петров и Денис Аникин Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

1 month, 4 weeks назад @ learnpython.podbean.com
Day Special: строки в Python или магия под капотом
Day Special: строки в Python или магия под капотом

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm

Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

2 months назад @ learnpython.podbean.com
Новости мира Python за март 2025
Новости мира Python за март 2025

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Django 5.2 — https://docs.djangoproject.com/en/5.2/releases/5.2/ PEP 751, стандарт lock-файлов в Python — https://peps.python.org/pep-0751/ Генерации UUIDv7 включена в стандартную библиотеку Python — https://habr.com/ru/news/887958/ Here’s how I use LLMs to help me write code — https://simonwillison.net/2025/Mar/11/using-llms-for-code/ PEP 779: Criteria for supported status for free-threaded Python — https://peps.python.org/pep-0779/ и https://discuss.python.org/t/pep-779-criteria-for-supported-status-for-free-threaded-python/84319 Setuptools 78.0.1 breaks the internet …

2 months, 2 weeks назад @ learnpython.podbean.com
Для чего пишут на Python в Meta
Для чего пишут на Python в Meta

Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf

3 months назад @ learnpython.podbean.com
Новости мира Python за февраль 2025
Новости мира Python за февраль 2025

https://python-day.python.ru — CFP Python Day

Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Первая бета LTS-релиза Django 5.2 - https://docs.djangoproject.com/en/dev/releases/5.2/ PEP 772 – Packaging governance process https://peps.python.org/pep-0772/ Official Django MongoDB Backend Public Preview - https://www.mongodb.com/blog/post/mongodb-django-backend-now-available-public-preview Poetry — https://python-poetry.org/blog/announcing-poetry-2.0.0/ Проекты на PyPI теперь можно помечать как архивные https://blog.pypi.org/posts/2025-01-30-archival/

Отклонили PEP 2026 – Calendar versioning for Python - https://peps.python.org/pep-2026/

Developer philosophy — https://qntm.org/devp…

3 months, 2 weeks назад @ learnpython.podbean.com
Заменит ли AI разработчиков / ждет ли нас AGI / зачем агентские системы разработчику
Заменит ли AI разработчиков / ждет ли нас AGI / зачем агентские системы разработчику

Предварительная запись на офлайн-курс Learn Python в Москве — https://forms.gle/wE7Lit97U9Q2q3oT9 CFP Python Day — https://python-day.python.ru Ведущие – Григорий Петров и Михаил Корнеев Ссылки от Александра Храмогина:

RAG — https://github.com/langgenius/dify - https://dify.ai/ База по промтингу — https://learnprompting.org/docs/introduction Релевантный Roadmap — https://roadmap.sh/ai-engineer Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — htt…

4 months назад @ learnpython.podbean.com
Итоги года мира Python 2024
Итоги года мира Python 2024

Предварительная запись на офлайн-курс Learn Python в Москве — https://forms.gle/wE7Lit97U9Q2q3oT9 Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: Safe external debugger interface for CPython — https://peps.python.org/pep-0768/

результат опроса Facebook об аннотациях типов в Python — https://engineering.fb.com/2024/12/09...

возможность указывать SBOM-файлы в pyproject.toml — https://peps.python.org/pep-0770/

Сравнение Django и FastAPI — https://www.david-dahan.com/blog/comp...

предложение по добавлению выравнивания в PEP 8 — https://discuss.python.org/t/pep-8-mo... Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_pyt…

4 months, 2 weeks назад @ learnpython.podbean.com
Итоги года мира Python 2024
Итоги года мира Python 2024

Спонсор подкаста: курсы по Python-разработке для тех, кто уже знаком с веб-разработкой — https://vk.cc/cADwoW Ведущие – Григорий Петров и Михаил Корнеев Обсудили в выпуске: Релиз Python 3.13 Top Python Libraries 2024 — https://tryolabs.com/blog/top-python-libraries-2024 Фичи для обеспечения безопасности PyPI (обязательный 2FA, trusted publishers) Релиз нового менеджера пакетов UV Завершение поддержки Python 3.8 Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

5 months, 2 weeks назад @ learnpython.podbean.com
Новости Python за ноябрь 2024
Новости Python за ноябрь 2024

Предварительная запись на офлайн-курс Learn Python в Москве — https://forms.gle/wE7Lit97U9Q2q3oT9

Спонсор подкаста: курсы по Python-разработке для тех, кто уже знаком с веб-разработкой — https://vk.cc/cADwoW Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска Python сместил Javascript с первого места по используемости — https://github.blog/news-insights/octoverse/octoverse-2024/ PEP 750 – Template Strings — https://peps.python.org/pep-0750/ Эксперементальная поддержка partial validation в Pydantic 2.10 — https://pydantic.dev/articles/pydantic-v2-10-release#support-for-partial-validation-with-experimental_allow_partial PyPI теперь поддерживает цифровую сертификацию — https://blog.pypi…

6 months, 1 week назад @ learnpython.podbean.com
Как из Python, Open source и такой-то матери построить бизнес
Как из Python, Open source и такой-то матери построить бизнес

Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

7 months назад @ learnpython.podbean.com
3.13 и другие новости за октябрь 2024
3.13 и другие новости за октябрь 2024

Спонсор подкаста: курсы по Python-разработке для тех, кто уже знаком с веб-разработкой — https://vk.cc/cADwoW Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска:

Python 3.13 — https://pythoninsider.blogspot.com/2024/10/python-3130-final-released.html Jacob Kaplan-Moss рассказал о финансах Django Software Foundation — https://jacobian.org/2024/oct/8/dsf-one-million/ PEP 735 — https://peps.python.org/pep-0735/ PEP 758 — https://peps.python.org/pep-0758/ PEP 761 — https://peps.python.org/pep-0761/ PEP 760 — https://peps.python.org/pep-0760/ Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Teleg…

7 months, 3 weeks назад @ learnpython.podbean.com
Podlodka Podcast Podlodka Podcast
последний пост 6 days, 17 hours назад
Podlodka #429 – Fear of missing out
Podlodka #429 – Fear of missing out Podlodka #429 – Fear of missing out

Последнее время куда ни посмотришь – все уже начали использовать AI, код вовсю пишут агенты, количество успешных стартапов растет, а всех программистов скоро обещают разогнать. Из-за этого у многих появляется сильная тревога выражающаяся в FOMO – Fear of missing out – ощущении, что все что-то знают и делают, а только ты – нет. Чтобы разобраться, откуда берется это чувство, насколько ему стоит верить, и как с ним бороться, мы позвали Евгения Кота, менеджера с 20-летним стажем в IT и психологическим образованием за плечами. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook…

6 days, 17 hours назад @ soundcloud.com
Podlodka #428 – Как и зачем писать хорошие тексты?
Podlodka #428 – Как и зачем писать хорошие тексты? Podlodka #428 – Как и зачем писать хорошие тексты?

Если ИИ теперь пишет за нас – зачем этому учиться? Вместе с Галиной Юзефович разбираемся, почему навык письма всё ещё актуален, как он прокачивает мышление, и что именно делает текст хорошим. Спойлер: хороший текст – это не продукт вдохновения, а четкая структура и тщательная работа с идеями. Как читать, чтобы писать лучше? Какие вопросы задавать себе в процессе? Какие конструкции и фреймворки действительно работают? И с чего начать, если хочется научиться? Всё это – в новом выпуске!

Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitte…

1 week, 6 days назад @ soundcloud.com
Podlodka #427 – AI в небольших командах
Podlodka #427 – AI в небольших командах Podlodka #427 – AI в небольших командах

С каждой неделей AI становится все умнее, и это влияет не только на то, как пишется код, но и на то, как работают целые команды. Андрей Володин – фаундер стартапа Gracia, рассказал про то, как AI агенты изменили его собственный подход к разработке, как поменялись роли в их команде, инженерные стандарты, технический стек, и как в итоге они ускорились во много раз, не жертвуя при этом качеством. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в выпуске:

Катя Петрова, Егор Толстой…

2 weeks, 6 days назад @ soundcloud.com
Podlodka #426 – Мнемотехника: запомнить всё
Podlodka #426 – Мнемотехника: запомнить всё Podlodka #426 – Мнемотехника: запомнить всё

Почему мозг так упрямо забывает важное, но помнит строчки из рекламы 2007 года? Что вообще такое память и можно ли натренировать её так, чтобы не забывать ни имён, ни паролей, ни зачем пришёл на кухню? Разбираемся, как устроено запоминание, почему эмоции и внимание — это топливо для памяти, и как мнемотехника превращает мозг в суперхранилище. Вспоминаем истории чемпионатов по запоминанию, смотрим, что говорит нейронаука, и обсуждаем, как связаны насмотренность, креатив и способность держать в голове абстрактные концепции. Байки, наука, техники — всё как мы любим! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: htt…

3 weeks, 5 days назад @ soundcloud.com
Podlodka #425 – Языки программирования будущего
Podlodka #425 – Языки программирования будущего Podlodka #425 – Языки программирования будущего

Кто-то говорит, что нынешний бум AI – это просто хайп. А кто-то видит в нем смену парадигмы разработки. А что, если вместо написания кода разработчики будут описывать бизнес-логику и требования, а ИИ будет трансформировать все это в код? Как это могло бы работать – обсуждаем с Андреем Бреславом на примере его нынешнего проекта! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в выпуске:

Женя Кателла, Катя Петрова Полезные ссылки: Проект Андрея https://codespeak.dev

1 month назад @ soundcloud.com
Podlodka #424 – Нейроинтерфейсы
Podlodka #424 – Нейроинтерфейсы Podlodka #424 – Нейроинтерфейсы

Нейроинтерфейсы — это всё ещё про научную фантастику или уже про реальность? Можно ли играть в WoW силой мысли? А киборги — они уже среди нас? Neuralink и Илон Маск — это хайповый маркетинг или реально будущее индустрии?

Чтобы разобраться, нужно сначала хотя бы немного понять, как работает мозг, а потом посмотреть, на что способны нейроинтерфейсы — инвазивные, неинвазивные и полуинвазивные. В чем их ограничения, в чём потенциал, и что уже умеет наука и индустрия.

Всё это (+ байки, куда же без них!) обсуждаем в выпуске вместе с нейроучёным и кандидатом психологических наук Ильёй Захаровым. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/po…

1 month, 1 week назад @ soundcloud.com
Podlodka #423 – Groovy
Podlodka #423 – Groovy Podlodka #423 – Groovy

Продолжаем наше погружение в экосистему JVM и пополняем коллекцию языковых выпусков — на этот раз вместе с Барухом Садогурским обсуждаем Groovy!

Что делает Groovy по-настоящему groovy 🕺🏼 ? Какие фишки помогали ему претендовать на звание более веселой и дружелюбной альтернативы Java? В каких нишах язык в итоге закрепился — и почему это DSL? Правда ли, что если бы не Kotlin, всё могло бы сложиться совсем иначе? Детальный разбор языка, весёлые байки и щепоточка конспирологии — включайте новый выпуск! Ждем тебя 26-го мая на Java Podlodka Crew. Тема конференции "Java и производительность". По промокоду GROOVY будет приятная скидка. Не пропусти сезон! Забирай билет: https://podlodka.io/javacrew Т…

1 month, 2 weeks назад @ soundcloud.com
Podlodka #422 – Spring Framework
Podlodka #422 – Spring Framework Podlodka #422 – Spring Framework

Обсуждаем самый знаменитый фреймворк из мира Java – Spring Framework. Что у него под капотом, почему он такой, какой он есть, и что ждет его в мире победивших LLM – разбираемся вместе с Евгением Борисовым! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodlodkaPodcast Ведущие в выпуске:

Женя Кателла, Катя Петрова Полезные ссылки: ТГ-канал гостя t.me/borisovtrainings

1 month, 3 weeks назад @ soundcloud.com
Podlodka #421 – Прогнозирование погоды
Podlodka #421 – Прогнозирование погоды Podlodka #421 – Прогнозирование погоды

За последнее десятилетие технологии сделали огромный скачок вперед: в наши карманах лежат вычислительные устройства невероятной мощи, а искусственный интеллект вот-вот перешагнет порог AGI. Но при всем при этом получить надежный прогноз погоды на месяц вперед – задача где-то за гранью реальности. Чтобы разобраться, почему погода – это настолько сложно, мы позвали Александра Ганьшина, руководителя Яндекс Погоды, который рассказал кучу интересного про историю развития методов прогнозирования, state of the art пайплайны сбора и обработки данных, и даже про то, как на данных о погоде строить бизнес. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://…

2 months назад @ soundcloud.com
Podlodka #420 – Crystal
Podlodka #420 – Crystal Podlodka #420 – Crystal

Все языки программирования вдохновляются друг другом, но иногда эволюцию конкретных идей между языками отследить довольно сложно. Crystal – уникальный случай. Его авторы одновременно невероятно сильно любили синтаксис Ruby и компилируемые языки со статической типизацией. В итоге у них получился очень душевный язык, на котором можно выразительно описывать как высокоуровневую бизнес-логику, так и требовательный к производительности низкоуровневый код. Сергей Кузнецов - разработчик дебаггера для Crystal, поделился своей большой любовью к языку и рассказал много интересного про то, как он устроен. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.…

2 months, 1 week назад @ soundcloud.com
Podlodka #419 – Готовим красиво между митингами
Podlodka #419 – Готовим красиво между митингами Podlodka #419 – Готовим красиво между митингами

В этом выпуске С Тоней Поповой говорим о том, как подружиться с едой и сделать готовку частью повседневной жизни: не изматывающей, а вдохновляющей. Обсуждаем что такое “лего-подход” к готовке, и как один кусок тыквы превращается в три разных блюда; как сделать еду красивой, не используя трюфели и золото; как собрать удобную и рабочую кладовую, которая сэкономит деньги, время и нервные клетки; почему планеры питания не работают и как сделать, чтобы заработали; какой минимум посуды нужен, чтобы вы не бросили готовить через неделю. Этот выпуск для всех, кто хочет начать готовить вкусно, красиво и просто и готовить чаще, но тратить на это меньше сил. Также ждем вас, ваши лайки, репосты и коммен…

2 months, 2 weeks назад @ soundcloud.com
Podlodka #418 – Профессия: системный аналитик
Podlodka #418 – Профессия: системный аналитик Podlodka #418 – Профессия: системный аналитик

Системный аналитик — тот самый невидимый связующий элемент между бизнесом и технологиями. В новом выпуске вместе с Ольгой Пономарёвой, основательницей онлайн-школы по системному анализу, разбираемся, чем эта роль отличается от бизнес-аналитики, как распределяются зоны ответственности между продактами, системными аналитиками и архитекторами, и какие конфигурации команд самые эффективные. Обсуждаем, что ждёт системных аналитиков в эпоху AI, куда можно расти дальше и как понять, что эта сфера — твоя и как вкатиться в айти через системный анализ. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanew…

2 months, 3 weeks назад @ soundcloud.com
Podlodka #417 – Swift
Podlodka #417 – Swift Podlodka #417 – Swift

Большинство из вас знает Swift как нишевый язык для iOS разработки. Но на самом деле – это очень круто задизайненный язык программирования общего назначения, который по многим параметрам выигрывает у C++ или Rust. Swift избегает крайностей и находит качественный баланс, оставаясь консервативным там, где это нужно, и при этом привнося много новых идей. Про историю развития, ключевые фичи и необычные технические концепции в языке нам рассказал Глеб Лукьянец. Партнер эпизода — экосистема для бизнеса Контур. Каждая третья компания в России пользуется их продуктами. 2500+ разработчиков развивают сервисы и инфраструктурные решения на C# под .NET, Python, Java, Go. Все iOS-приложения написаны на S…

3 months назад @ soundcloud.com
Podlodka #416 – Node.js
Podlodka #416 – Node.js Podlodka #416 – Node.js

Node.js начинался с невинного вопроса: «А что будет, если запустить Javascript вне браузера?». Несмотря на предубеждения и скепсис, отрицать бессмысленно – эксперимент удался, ведь миллионы разработчиков используют Node.js каждый день. Почему так вышло – разбираемся с Игорем Антоновым! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodlodkaPodcast Ведущие в выпуске:

Женя Кателла, Катя Петрова Полезные ссылки: Блог «Про JavaScript и разработку» в телеграм — https://t.me/antonovjs

Блог «Про JavaScript …

3 months, 1 week назад @ soundcloud.com
Podlodka #415 – Лямбда исчисление
Podlodka #415 – Лямбда исчисление Podlodka #415 – Лямбда исчисление

Лямбда исчисление — база! Или нет? Разбираемся в новом выпуске с Виталием Брагилевским! Как лямбда исчисление появилось и почему эта формальная система так мощна и изящна? Как связаны между собой Чёрч и Тьюринг? И как в конце-концов труды Чёрча повлияли на Lisp, Haskell, и другие функциональные языки? История, математика, теория языков программирования и щепоточка отборного юмора — скорее включайте новый выпуск, чтобы насладиться всем и сразу! Партнёр эпизода — компания YADRO. YADRO — это крупнейшая технологическая компания, которая создает фундаментальные для российского рынка продукты, начиная от серверов, и заканчивая собственной базовой станцией. Большое инженерное сообщество, амбициозн…

3 months, 2 weeks назад @ soundcloud.com
Проветримся! Проветримся!
последний пост 1 month, 4 weeks назад
Борис Тарасов: от Маруси до Ровера
Борис Тарасов: от Маруси до Ровера

Борис Тарасов занимается промышленным дизайном в avride. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

1 month, 4 weeks назад @ buzzsprout.com
Книжный клуб: Диапазон
Книжный клуб: Диапазон

https://www.goodreads.com/book/show/41795733-range Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

2 months, 1 week назад @ buzzsprout.com
Анна Ривина: домашнее насилие
Анна Ривина: домашнее насилие

Анна Ривина эксперт по теме домашнего насилия и гендерной дискриминации, основательница Центра «Насилию.нет», Rivina Foundation и проекта Labirint. Поддержать русскоязычных женщин в эмиграции, которые оказались в ситуации насилия, можно здесь: https://rivina.foundation/supporteng/ Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

2 months, 2 weeks назад @ buzzsprout.com
Книжный клуб: Амстердам История Самого Либерального Города
Книжный клуб: Амстердам История Самого Либерального Города

Пытаемся перезапустить сезон и пробуем новый формат: обзор книги. https://www.goodreads.com/book/show/17288660-amsterdam Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

2 months, 2 weeks назад @ buzzsprout.com
Александр Мерзликин: чемпионат по сну
Александр Мерзликин: чемпионат по сну

Александр Мерзликин — основатель стартапа Sleeptery, который предлагает игровой подход для улучшения сна.Support the showApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8yПатреон: https://www.patreon.com/progulka

6 months, 2 weeks назад @ buzzsprout.com
Надежда Бей: Фиджитал Искусство
Надежда Бей: Фиджитал Искусство

Надежда Бей — VR-художница и резидент фиджитал галереи Охра.Канал Нади: https://t.me/irrealartКанал Охры: https://t.me/phygitalgalleryПолезные книги:Ната Покровская и Антон Уткин: Белое зеркало. Учебник по интерактивному сторителлингу в кино, VR и иммерсивном театре.Cyane Tornatzky, Brendan Kelley "An Artistic Approach to Virtual Reality"Curtis Hickman "Hyper-reality: The art of designing impossible experiences"Кристиана Пол "Цифровое искусство"Support the showApplePodcasts: https://apple.co/...

6 months, 3 weeks назад @ buzzsprout.com
Никита Калинин: петербургская математическая школ
Никита Калинин: петербургская математическая школ

Никита Калинин — Associate Professor в Технионе в Гуанджоу и автор канала Tropical Saint-Petersburg. Мы поговорили с ним про Петебругскую математику и математиков.Support the showApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8yПатреон: https://www.patreon.com/progulka

7 months назад @ buzzsprout.com
Елена Доброхотова: как сказать смерти "не сейчас"
Елена Доброхотова: как сказать смерти "не сейчас"

Елена Доброхотова — сооснователь стартапа Not Yet. Мы поговорили с ней о рынке медицинских носимых устройств, о здоровье и старении.Support the showApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8yПатреон: https://www.patreon.com/progulka

7 months, 1 week назад @ buzzsprout.com
Игорь Кузьмичев: чудаки города Ленинграда
Игорь Кузьмичев: чудаки города Ленинграда

Игорь Кузьмичёв исследует "вторую культуру" Ленинграда и ведёт телеграм-канал "Здесь был Майк" Telegram: t.me/mikewashereSupport the showApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8yПатреон: https://www.patreon.com/progulka

7 months, 2 weeks назад @ buzzsprout.com
Геннадий Асиньяров: "Марсианин" из Красноярска
Геннадий Асиньяров: "Марсианин" из Красноярска

Геннадий Асиньяров — кандидат биологических наук, участник проекта БИОС-3 в рамках которого исследовались возможности замкнутых систем жизнеобеспечения. Такие системы гипотетически могли бы использоваться для колонизации Марса.Геннадий Захарович также один из создателей методики НООГЕН. Книга: https://shorturl.at/vC2vwSupport the showApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8yПатреон: https://www.patreon.com/progulka

7 months, 3 weeks назад @ buzzsprout.com
Сергей Нурк: как и зачем читают геном
Сергей Нурк: как и зачем читают геном

Сергей Нурк руководит командой разработки биоинформатических инструментов в Oxford Nanopore technologies.Support the showApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8yПатреон: https://www.patreon.com/progulka

8 months назад @ buzzsprout.com
Александр Гечис: "GTA" на автозаводе
Александр Гечис: "GTA" на автозаводе

Александр Гечис разрабатывает алгоритмы для немецкого стартапа Kopernikus Automotive. Благодаря работе Александра автомобили сами могут перемещаться по фабрике от цеха к цеху в процессе производства.Support the showApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8yПатреон: https://www.patreon.com/progulka

8 months, 2 weeks назад @ buzzsprout.com
Вы находитесь здесь Вы находитесь здесь
последний пост None
Comand Line Heroes by RedHat Comand Line Heroes by RedHat
последний пост None
Python Bytes Python Bytes
последний пост 6 days, 20 hours назад
#436 Slow tests go last
#436 Slow tests go last #436 Slow tests go last

Topics include , typed-ffmpeg, pyleak, and Optimizing Test Execution: Running live_server Tests Last with pytest.

6 days, 20 hours назад @ pythonbytes.fm
#435 Stop with .folders in my ~/
#435 Stop with .folders in my ~/ #435 Stop with .folders in my ~/

Topics include platformdirs, poethepoet, Python Pandas Ditches NumPy for Speedier PyArrow, and pointblank: Data validation made beautiful and powerful.

1 week, 6 days назад @ pythonbytes.fm
#434 Most of OpenAI’s tech stack runs on Python
#434 Most of OpenAI’s tech stack runs on Python #434 Most of OpenAI’s tech stack runs on Python

Topics include Making PyPI’s test suite 81% faster, People aren’t talking enough about how most of OpenAI’s tech stack runs on Python, PyCon Talks on YouTube, and Optimizing Python Import Performance.

2 weeks, 6 days назад @ pythonbytes.fm
#433 Dev in the Arena
#433 Dev in the Arena #433 Dev in the Arena

Topics include git-flight-rules, Uravelling t-strings, neohtop, and Introducing Pyrefly: A new type checker and IDE experience for Python.

3 weeks, 6 days назад @ pythonbytes.fm
#432 How To Fix Your Computer
#432 How To Fix Your Computer #432 How To Fix Your Computer

Topics include pre-commit: install with uv, PEP 773, Changes for Textual, and The Best Programmers I Know.

1 month назад @ pythonbytes.fm
#431 Nerd Gas
#431 Nerd Gas #431 Nerd Gas

Topics include pirel: Python release cycle in your terminal, FastAPI Cloud, and Python's new t-strings.

1 month, 2 weeks назад @ pythonbytes.fm
#430 Or you go to jail
#430 Or you go to jail #430 Or you go to jail

Topics include pip 25.1 has dependency groups, pylock.toml, plus more, aiohttp goes free threaded, uv 0.6.15 supports pylock.toml, and Whenever.

1 month, 3 weeks назад @ pythonbytes.fm
#429 Nitpicking Python
#429 Nitpicking Python #429 Nitpicking Python

Topics include Huly, CVE Foundation, drawdb, and 14 Advanced Python Features.

2 months назад @ pythonbytes.fm
#428 How old is your Python?
#428 How old is your Python? #428 How old is your Python?

Topics include How to Write a Git Commit Message, Caddy Web Server, , and juv.

2 months, 1 week назад @ pythonbytes.fm
#427 Rise of the Python Lord
#427 Rise of the Python Lord #427 Rise of the Python Lord

Topics include Git Town, PEP 751 – A file format to record Python dependencies for installation reproducibility, git-who watchgha, and Share Python Scripts Like a Pro: uv and PEP 723 for Easy Deployment.

2 months, 2 weeks назад @ pythonbytes.fm
#426 Committing to Formatted Markdown
#426 Committing to Formatted Markdown #426 Committing to Formatted Markdown

Topics include mdformat, pre-commit-uv, , and Serie books.

2 months, 3 weeks назад @ pythonbytes.fm
#425 If You Were a Klingon Programmer
#425 If You Were a Klingon Programmer #425 If You Were a Klingon Programmer

Topics include Why aren't you using uv, Python Developer Tooling Handbook, Calling all doc writers: blacken-docs, and Reinventing notebooks as reusable Python programs.

3 months назад @ pythonbytes.fm
#424 We Will Test in Production
#424 We Will Test in Production #424 We Will Test in Production

Topics include The weird quirk with rounding in Python, Python interpreter adds tail calls, Remove punctuation from a string with translate and maketrans, and.

3 months, 1 week назад @ pythonbytes.fm
#423 Traveling the Python Universe
#423 Traveling the Python Universe #423 Traveling the Python Universe

Topics include pysqlscribe, A map of Python, Rust, C++, and Python trends in jobs on Hacker News 2025), and The features of Python's help() function.

3 months, 2 weeks назад @ pythonbytes.fm
#422 You need 4 spaces
#422 You need 4 spaces #422 You need 4 spaces

Topics include My 2025 uv-based Python Project Layout for Production Apps, aiolimiter, A peek into a possible future of Python in the browser, and Reloadium.

3 months, 3 weeks назад @ pythonbytes.fm
Software Engineering Daily Software Engineering Daily
последний пост 3 days, 19 hours назад
Emulating Retro Games on Modern Consoles with Robin Lavallée and Bill Litshauer
Emulating Retro Games on Modern Consoles with Robin Lavallée and Bill Litshauer

Emulating retro games on modern consoles is a growing trend, and allows players to experience classic titles with improved performance, enhanced resolution, and added features like save states and rewinding. However, this process raises many challenging technical questions related to hardware compatibility, performance optimization, rendering, and state management. Implicit Conversions is a company focused on

The post Emulating Retro Games on Modern Consoles with Robin Lavallée and Bill Litshauer appeared first on Software Engineering Daily.

3 days, 19 hours назад @ softwareengineeringdaily.com
SED News: Corporate Spies, Postgres, and the Weird Life of Devs Right Now
SED News: Corporate Spies, Postgres, and the Weird Life of Devs Right Now

Welcome back to SED News, a podcast series from Software Engineering Daily where hosts Gregor Vand and Sean Falconer break down the latest stories in software engineering, Silicon Valley, and wider tech world. In this episode, Gregor and Sean unpack what’s going with Deel and Rippling, explore why Databricks and Snowflake are making big bets

The post SED News: Corporate Spies, Postgres, and the Weird Life of Devs Right Now appeared first on Software Engineering Daily.

5 days, 19 hours назад @ softwareengineeringdaily.com
TanStack and the Future of Frontend with Tanner Linsley
TanStack and the Future of Frontend with Tanner Linsley

TanStack is an open-source collection of high-performance libraries for JavaScript and TypeScript applications, primarily focused on state management, data fetching, and table utilities. It includes popular libraries like TanStack Query, TanStack Table, and TanStack Router. These libraries emphasize declarative APIs, optimized performance, and developer-friendly features, and they are increasingly popular for modern frontend development. Tanner

The post TanStack and the Future of Frontend with Tanner Linsley appeared first on Software Engineering Daily.

1 week, 3 days назад @ softwareengineeringdaily.com
The Challenge of AI Model Evaluations with Ankur Goyal
The Challenge of AI Model Evaluations with Ankur Goyal

Evaluations are critical for assessing the quality, performance, and effectiveness of software during development. Common evaluation methods include code reviews and automated testing, and can help identify bugs, ensure compliance with requirements, and measure software reliability. However, evaluating LLMs presents unique challenges due to their complexity, versatility, and potential for unpredictable behavior. Ankur Goyal is

The post The Challenge of AI Model Evaluations with Ankur Goyal appeared first on Software Engineering Daily.

1 week, 5 days назад @ softwareengineeringdaily.com
Modern Distributed Applications with Stephan Ewen
Modern Distributed Applications with Stephan Ewen

A major challenge with creating distributed applications is achieving resilience, reliability, and fault tolerance. It can take considerable engineering time to address non-functional concerns like retries, state synchronization, and distributed coordination. Event-driven models aim to simplify these issues, but often introduce new difficulties in debugging and operations. Stephan Ewen is the Founder at Restate which

The post Modern Distributed Applications with Stephan Ewen appeared first on Software Engineering Daily.

2 weeks, 3 days назад @ softwareengineeringdaily.com
Crew AI with João Moura
Crew AI with João Moura

Agentic AI is seen as a key frontier in artificial intelligence, enabling systems to autonomously act, adapt in real-time, and solve complex, multi-step problems based on objectives and context. Unlike traditional rule-based or generative AI, which are limited to predefined or reactive tasks, agentic AI processes vast information, models uncertainty, and makes context-sensitive decisions, mimicking

The post Crew AI with João Moura appeared first on Software Engineering Daily.

2 weeks, 5 days назад @ softwareengineeringdaily.com
Chip Design in the AI Era with Thomas Andersen
Chip Design in the AI Era with Thomas Andersen

Synopsys is a leading electronic design automation company specializing in silicon design and verification, as well as software integrity and security. Their tools are foundational to the creation of modern chips and embedded software, powering everything from smartphones to cars. Chip design is a deeply complex process, often taking months or years and requiring the

The post Chip Design in the AI Era with Thomas Andersen appeared first on Software Engineering Daily.

3 weeks, 3 days назад @ softwareengineeringdaily.com
OpenTofu with Cory O’Daniel and Malcolm Matalka
OpenTofu with Cory O’Daniel and Malcolm Matalka

OpenTofu is an open-source alternative to Terraform, designed for managing infrastructure as code. It enables users to define, provision, and manage their cloud and on-premises resources using a declarative configuration language. OpenTofu was created to ensure an open and community-driven approach to infrastructure tooling, and it emphasizes compatibility and extensibility for diverse deployment scenarios. Cory

The post OpenTofu with Cory O’Daniel and Malcolm Matalka appeared first on Software Engineering Daily.

3 weeks, 5 days назад @ softwareengineeringdaily.com
Mojo and Building a CUDA Replacement with Chris Lattner
Mojo and Building a CUDA Replacement with Chris Lattner

Python is the dominant language for AI and data science applications, but it lacks the performance and low-level control needed to fully leverage GPU hardware. As a result, developers often rely on NVIDIA’s CUDA framework, which adds complexity and fragments the development stack. Mojo is a new programming language designed to combine the simplicity of

The post Mojo and Building a CUDA Replacement with Chris Lattner appeared first on Software Engineering Daily.

1 month назад @ softwareengineeringdaily.com
Building PostgreSQL for the Future with Heikki Linnakangas
Building PostgreSQL for the Future with Heikki Linnakangas

PostgreSQL is an open-source database known for its robustness, extensibility, and compliance with SQL standards. Its ability to handle complex queries and maintain high data integrity has made it a top choice for both start-ups and large enterprises. Heikki Linnakangas is a leading developer for the PostgreSQL project, and he’s a co-founder at Neon, which

The post Building PostgreSQL for the Future with Heikki Linnakangas appeared first on Software Engineering Daily.

1 month назад @ softwareengineeringdaily.com
Security at Coinbase with Philip Martin
Security at Coinbase with Philip Martin

Cryptocurrency exchanges face unique security challenges that require specialized threat assessments and planning. Coinbase is a cryptocurrency exchange based in the United States. It was founded in 2012 and has evolved alongside cryptocurrency as a technology. Philip Martin is the Chief Security Officer at Coinbase. Prior to Coinbase, Philip built and led the Incident Response

The post Security at Coinbase with Philip Martin appeared first on Software Engineering Daily.

1 month, 1 week назад @ softwareengineeringdaily.com
Anthropic and the Model Context Protocol with David Soria Parra
Anthropic and the Model Context Protocol with David Soria Parra

The Model Context Protocol, or MCP, is a new open standard that connects AI assistants to arbitrary data sources and tools, such as codebases, APIs, and content repositories. Instead of building bespoke integrations for each system, developers can use MCP to establish secure, scalable connections between AI models and the data they need. By standardizing

The post Anthropic and the Model Context Protocol with David Soria Parra appeared first on Software Engineering Daily.

1 month, 1 week назад @ softwareengineeringdaily.com
Grand Theft Auto III on the Dreamcast with Falco Girgis and Stef Kornilios Mitsis Poiitidis
Grand Theft Auto III on the Dreamcast with Falco Girgis and Stef Kornilios Mitsis Poiitidis

Grand Theft Auto III is a 2001 an open-world action-adventure game developed by Rockstar Games and it had a profound impact on both gaming and popular culture. Its success cemented video games as a dominant form of entertainment and storytelling, and paved the way for future blockbuster franchises. The game was also a technological milestone

The post Grand Theft Auto III on the Dreamcast with Falco Girgis and Stef Kornilios Mitsis Poiitidis appeared first on Software Engineering Daily.

1 month, 2 weeks назад @ softwareengineeringdaily.com
Polypane with Kilian Valkhof
Polypane with Kilian Valkhof

Polypane is a specialized web development browser that simplifies creating and testing modern websites. A key feature is that it provides multiple screen sizes at once, with synchronized scrolling and interactions, so developers can test different layouts and breakpoints simultaneously. Polypane also focuses on accessibility tools, real-time previews, and debugging features. Kilian Valkhof is the

The post Polypane with Kilian Valkhof appeared first on Software Engineering Daily.

1 month, 2 weeks назад @ softwareengineeringdaily.com
LiveKit and OpenAI with Russ d’Sa
LiveKit and OpenAI with Russ d’Sa

LiveKit is a platform that provides developers with tools to build real-time audio and video applications at scale. It offers an open-source WebRTC stack for creation of live, interactive experiences like video conferencing, streaming, and virtual events. LiveKit has gained significant attention for its partnership with OpenAI for the Advanced Voice feature. Russ d’Sa is

The post LiveKit and OpenAI with Russ d’Sa appeared first on Software Engineering Daily.

1 month, 3 weeks назад @ softwareengineeringdaily.com
Habr Podcasts Habr Podcasts
последний пост None
Мысли и Методы Мысли и Методы
последний пост None
⌨ Coding
Martin Fowler
последний пост 3 days, 15 hours назад
Expert Generalists: three more characteristics
Expert Generalists: three more characteristics Expert Generalists: three more characteristics

We've long noticed that not just anyone succeeds as an Expert Generalist, but once we understand the traits that are key for such Expert Generalists, organizations can shape learning programs, hiring filters, and career paths that deliberately develop them.

(But beware, we find many Expert Generalists, including at least one author of this article, cringe at the word “expert”.)

The Characteristics of an Expert Generalist When we've observed Expert Generalists, there are certain attributes that stand out.

Curiosity Expert generalists are full of curiosity Expert Generalists display a lot of curiosity.

This characteristic is noticeable when Expert Generalists get an answer to a question.

3 days, 15 hours назад @ martinfowler.com
Expert Generalists: first three characteristics
Expert Generalists: first three characteristics Expert Generalists: first three characteristics

I've since been dismissed as a “patterns guy”, “agile guy”, “architecture guy”, “java guy”, “ruby guy”, and “anti-architect guy”.

Specialists are seen as people with a deep skill in a specific subject, while generalists have broad but shallow skills.

We've seen this capability be an essential quality in our best colleagues, to the degree that its importance is something we've taken for granted.

We've long noticed that not just anyone succeeds as an Expert Generalist, but once we understand the traits that are key for such Expert Generalists, organizations can shape learning programs, hiring filters, and career paths that deliberately develop them.

(But beware, we fin…

4 days, 15 hours назад @ martinfowler.com
Autonomous coding agents: A Codex example
Autonomous coding agents: A Codex example Autonomous coding agents: A Codex example

  I’ll search for “to human” in the src directory to find relevant references.

  I’m checking if the category-to-human-readable transformation is handled in _navigation_items or elsewhere.

  I’m going to look up “human readable” to get more info on the topic.

  Filtering the search to just the “src” folder to avoid node_modules noise.

  I’m checking the whole repo in case the logic is in the backend or a library.

2 weeks, 4 days назад @ martinfowler.com
Should I still use analytics?
Should I still use analytics? Should I still use analytics?

Martin Fowler: 03 Jun 2025I set up Google Analytics on my site in 2010, and since then use it to track page views to my site.

I only care about page views, which I find useful to figure out which pages get the most traffic.

But Google collects much more information than just page views, and it’s tracking is more intrusive than I would like.

I took a look at it the following day, and everything seemed to be ok, but now, a couple of weeks later, page views reported by Google Analytics have dropped drastically.

Maybe I just live without analytics data.

2 weeks, 5 days назад @ martinfowler.com
Bliki: Say Your Writing
Bliki: Say Your Writing Bliki: Say Your Writing

This advice is for those who, like me, strive to get a conversational tone to their writings.

A lot of people are taught to write in a different way than they speak, but I find prose much more engaging with this conversational tone.

I've heard people say that when reading my work, they can hear me speaking it - which is exactly the effect I'm after.

Too often I read prose that feels flabby.

In my case I find I constantly (silently) speak the words as I'm writing.

3 weeks, 4 days назад @ martinfowler.com
Interviewed by James Lewis at goto Copenhagen
Interviewed by James Lewis at goto Copenhagen Interviewed by James Lewis at goto Copenhagen

At goto copenhagen last year, my friend James Lewis interviewed me and Goto have just released the video. I talk about when I learned about iterative design from Kent Beck, the dangers of product owners interfering with business-developer communication, and writing the agile manifesto. During this he specifically asked about my essay Is Design Dead. There's also a some audience questions asking if pair programming is a bad thing for introverts like us (no), and (inevitably) the role of LLMs for programmers today.

more…

1 month назад @ youtube.com
Refresh of Agile Threat Modeling
Refresh of Agile Threat Modeling Refresh of Agile Threat Modeling

We believe effective threat modeling should start simple and grow incrementally, rather than relying on exhaustive upfront analysis.

To demonstrate this in practice, we begin with outlining the core insights required for threat modeling.

We then dive into practical threat modeling examples using the STRIDE framework.

The key to cutting through complexity in threat modeling lies in tracing how data moves through your technology stack.

We use these STRIDE cards internally during threat modeling sessions either as printed cards or have them on screen.

1 month назад @ martinfowler.com
Building Custom Tooling with LLMs
Building Custom Tooling with LLMs Building Custom Tooling with LLMs

Diagram as code - A PlantUML primer Before diving into the development process, let's briefly introduce PlantUML for those who might be unfamiliar.

Step 2: Building the Parser Logic (and Debugging) “Now we need to parse the plantuml files and separate out step.

I'll help you create a Gradle task to process PlantUML files and generate step-by-step diagrams.

Now we need to generate a HTML viewer for the step files to be shown one by one.

This setup allowed us to quickly generate step diagrams from a single PlantUML file, and view them in a step by step manner.

1 month, 1 week назад @ martinfowler.com
Coding Assistants Threaten the Software Supply Chain
Coding Assistants Threaten the Software Supply Chain Coding Assistants Threaten the Software Supply Chain

We have long recognized that developer environments represent a weak point in the software supply chain.

As a result, any malicious code introduced at this stage can have a broad and significant impact radius particularly with sensitive data and services.

Coding assistants introduce new components and vulnerabilities to the software supply chain, but can also be owned or compromised themselves in novel and intriguing ways.

: Malicious responses from external tools or APIs can trigger unintended behaviors within the assistant, amplifying malicious instructions through feedback loops.

Escalation of privilege: A compromised assistant, particularly if lightly supervised, can execute deceptive o…

1 month, 1 week назад @ martinfowler.com
Function calling using LLMs
Function calling using LLMs Function calling using LLMs

Function calling is a capability that enables LLMs to go beyond simple text generation by interacting with external tools and real-world applications.

With function calling, an LLM can analyze a natural language input, extract the user’s intent, and generate a structured output containing the function name and the necessary arguments to invoke that function.

It’s important to emphasize that when using function calling, the LLM itself does not execute the function.

This part of the Chat Completions API call defines the available functions that the LLM can invoke, specifying their structure and purpose: tools=[ {"type": "function", "function": SEARCH_SCHEMA}, {"type": "function", "function": …

1 month, 2 weeks назад @ martinfowler.com
Building TMT Mirror Visualization with LLM
Building TMT Mirror Visualization with LLM Building TMT Mirror Visualization with LLM

This article documents a journey in building a complex, interactive UI with no prior experience in D3.js or UI development in general.

The work was done as part of building a prototype for an operational user interface for the telescope's primary mirror, designed to show real-time status of mirror segments.

Step 3: Adding a Second Hexagon “Nice... Now let's add one more hexagon next to this one.

Step 4: Creating the Second Row “Now let's add one more row.

The hexagons in the second row share vertical edges with each other similar to the first row.

1 month, 3 weeks назад @ martinfowler.com
Additional explanatory material for the Deepseek Overview
Additional explanatory material for the Deepseek Overview Additional explanatory material for the Deepseek Overview

DeepSeek uses more fine-grained experts than previous models, dividing them into two kinds: Shared Experts handle universal patterns for every token.

Co-Designed Frameworks: FP8, DualPipe, and PTX Optimizations Scaling an MoE model to 671B demanded HPC-level solutions for training and inference.

The authors emphasize: Through the co-design of algorithms, frameworks, and hardware, we overcome the communication bottleneck in cross-node MoE training, achieving near-full computation- communication overlap.

DeepSeek-R1: Reinforcement Learning for Deeper Reasoning It's worth noting that both DeepSeek R1 and DeepSeek R1-Zero are architecturally identical to DeepSeek V3.

This led them to DeepSeek-R…

2 months назад @ martinfowler.com
Guiding an LLM for Robust Java ByteBuffer Code
Guiding an LLM for Robust Java ByteBuffer Code Guiding an LLM for Robust Java ByteBuffer Code

We'll use the common task of reading and writing a fixed-structure header within a Java ByteBuffer.

The Scenario: Defining a Page Header Our goal is to create a Java class to manage a simple page header structure within a ByteBuffer.

LLM-Generated Code (Using position()) Certainly.

Using absolute offset methods avoids modifying the buffer's position state, which is much safer for shared or concurrent use cases.

Guiding Towards Robust Patterns: The developer explicitly prompted for stateless, absolute offset methods, leveraging deep knowledge of safe low-level programming practices.

2 months назад @ martinfowler.com
Updating yesterday's post on social media engagement
Updating yesterday's post on social media engagement Updating yesterday's post on social media engagement

Now when I announce a new article, I post on LinkedIn, Bluesky, Mastodon, as well as X (Twitter).

Here X (Twitter) shows a notable lead, but I strongly suspect that many of my followers there are inactive (or bots).

That indicates a clear pecking order with LinkedIn > X > Bluesky > Mastodon.

As we can see X (Twitter) was the dominant figure in 2023 but in 2025 LinkedIn has surged to a much greater amount of traffic.

Overall, I'd say that LinkedIn has taken over as the number one social network for my posts, but X (Twitter) is still important.

2 months, 2 weeks назад @ martinfowler.com
Social Media Engagement in Early 2025
Social Media Engagement in Early 2025 Social Media Engagement in Early 2025

Now when I announce a new article, I post on LinkedIn, Bluesky, Mastodon, as well as X (Twitter).

Here X (Twitter) shows a notable lead, but I strongly suspect that many of my followers there are inactive (or bots).

So every dot in the linkedIn column is the value for one linkedin post.

That indicates a clear pecking order with LinkedIn > X > Bluesky > Mastodon.

Overall, I'd say that LinkedIn has taken over as the number one social network for my posts, but X (Twitter) is still important.

2 months, 2 weeks назад @ martinfowler.com
Антон Жиянов Антон Жиянов
последний пост 1 month назад
fuzzy: Нечеткое сравнение строк в SQLite
fuzzy: Нечеткое сравнение строк в SQLite fuzzy: Нечеткое сравнение строк в SQLite

Cравнивать строки на похожесть и транслитерировать текст.

1 month назад @ antonz.ru
No-Code и заклинатели дождя
No-Code и заклинатели дождя No-Code и заклинатели дождя

Прощай, зерокод.

1 month назад @ antonz.ru
Stack Overflow помер (ну почти)
Stack Overflow помер (ну почти) Stack Overflow помер (ну почти)

Вернулся в 2007.

1 month, 1 week назад @ antonz.ru
Опыт с книгой
Опыт с книгой Опыт с книгой

Здесь денег нет.

2 months, 1 week назад @ antonz.ru
rand.Text
rand.Text rand.Text

Криптографически случайная строка.

3 months, 3 weeks назад @ antonz.ru
Метод-значение
Метод-значение Метод-значение

Функция с приколоченным к ней получателeм.

3 months, 4 weeks назад @ antonz.ru
Пропуск нулевых значений в JSON
Пропуск нулевых значений в JSON Пропуск нулевых значений в JSON

omitzero на замену omitempty.

4 months назад @ antonz.ru
SHA-3 и его друзья
SHA-3 и его друзья SHA-3 и его друзья

Больше криптографии.

4 months назад @ antonz.ru
Больше итераторов в Go 1.24
Больше итераторов в Go 1.24 Больше итераторов в Go 1.24

Больше итераторов в Go 1.24Как известно, в 1.23 авторы Go воспылали необъяснимой стратью к итератором, и этот пожар с тех пор только разгорается жарче.

Lines ( s ) { fmt .

SplitSeq ( s , "-" ) { fmt .

FieldsSeq ( s ) { fmt .

IsNumber ( c ) } s := "one,two;six..." for part := range strings .

4 months назад @ antonz.ru
Контекст для тестов
Контекст для тестов Контекст для тестов

Контекст для тестовДопустим, мы хотим протестировать этот жутко полезный сервер:// Дает ответы на все вопросы.

func startServer ( ctx context .

T ) { srv := startServer ( context .

) != 42 { t . Fatal ( "unexpected value" ) } }Тест проходит, но есть проблемка: я использовал пустой контекст, так что на самом деле сервер не остановился.

Background ()) defer cancel () srv := startServer ( ctx ) if srv .

4 months, 1 week назад @ antonz.ru
Как стать дата-сатанистом, не выходя из VS Code
Как стать дата-сатанистом, не выходя из VS Code Как стать дата-сатанистом, не выходя из VS Code

И сжечь все ноутбуки.

5 months, 3 weeks назад @ antonz.ru
Заглушить логи
Заглушить логи Заглушить логи

Через io.Discard.

6 months, 2 weeks назад @ antonz.ru
Say It in Russian
Say It in Russian Say It in Russian

Эмодзи-пак с текстовыми реакциями для телеграма.

6 months, 3 weeks назад @ antonz.ru
cmp.Or
cmp.Or cmp.Or

Редкий пример сахарка в Go.

7 months, 1 week назад @ antonz.ru
README для начинающих разработчиков
README для начинающих разработчиков README для начинающих разработчиков

На редкость толковая книга.

7 months, 3 weeks назад @ antonz.ru