SSS

Sentetik veriler hakkında Sıkça Sorulan Sorular

Anlaşılabilir! Neyse ki, cevaplara sahibiz ve yardım etmek için buradayız. Sık sorulan sorularımızı kontrol edin.

Lütfen aşağıda bir soru açın ve daha fazla bilgi bulmak için bağlantıları tıklayın. Burada belirtilmeyen daha karmaşık bir sorunuz mu var? Doğrudan uzmanlarımıza sorun!

en çok sorulan sorular

Sentetik veriler, gerçek dünya kaynaklarından toplanmak yerine yapay olarak oluşturulan verileri ifade eder. Genel olarak, kişilerle (müşteri, hasta vb.) tüm etkileşimlerinizde ve tüm iç süreçlerinizde orijinal veriler toplanırken, sentetik veriler bir bilgisayar algoritması ile üretilir.

Sentetik veriler, kontrollü bir ortamda modelleri test etmek ve değerlendirmek veya gerçek dünya verilerine benzer ancak herhangi bir hassas bilgi içermeyen veriler üreterek hassas bilgileri korumak için de kullanılabilir. Sentetik veriler genellikle gizliliğe duyarlı verilere alternatif olarak kullanılır ve analitik veya makine öğrenimini eğitmek için test verileri olarak kullanılabilir.

Daha fazla

Yapay verilerin orijinal verilerle aynı veri kalitesine sahip olmasını garanti etmek zor olabilir ve genellikle belirli kullanım durumuna ve sentetik verileri oluşturmak için kullanılan yöntemlere bağlıdır. Üretken modeller gibi sentetik veri üretmeye yönelik bazı yöntemler, orijinal verilere oldukça benzeyen veriler üretebilir. Anahtar soru: Bunu nasıl gösterebiliriz?

Sentetik verilerin kalitesini sağlamanın bazı yolları vardır:

  • Veri kalitesi raporumuz aracılığıyla veri kalitesi ölçümleri: Sentetik verilerin orijinal verilerle aynı veri kalitesine sahip olmasını sağlamanın bir yolu, sentetik verileri orijinal verilerle karşılaştırmak için veri kalitesi metriklerini kullanmaktır. Bu metrikler, verilerin benzerliği, doğruluğu ve eksiksizliği gibi şeyleri ölçmek için kullanılabilir. Syntho yazılımı, çeşitli veri kalitesi ölçümlerini içeren bir veri kalitesi raporu içeriyordu.
  • Dış değerlendirme: orijinal verilere kıyasla sentetik verilerin veri kalitesi kilit önemde olduğundan, yakın zamanda Syntho'nun sentetik verilerinin veri kalitesini gerçek verilerle karşılaştırarak göstermek için SAS'ın (analitikte pazar lideri) veri uzmanlarıyla bir değerlendirme yaptık. SAS analitik uzmanı Edwin van Unen, çeşitli analitik (AI) değerlendirmeleri aracılığıyla Syntho'dan oluşturulan sentetik veri kümelerini değerlendirdi ve sonuçları paylaştı. Bu videonun kısa bir özetini buradan izleyin.
  • Kendiniz test etme ve değerlendirme: sentetik veriler, gerçek dünya verileriyle karşılaştırılarak veya makine öğrenimi modellerini eğitmek için kullanılarak ve performansları gerçek dünya verileriyle eğitilmiş modellerle karşılaştırılarak test edilebilir ve değerlendirilebilir. Sentetik verilerin veri kalitesini neden kendiniz test etmiyorsunuz? Bunun olanaklarını uzmanlarımıza buradan sorun

Yapay verilerin orijinal verilere %100 benzer olduğunu asla garanti edemeyeceğine dikkat etmek önemlidir, ancak belirli bir kullanım durumu için yararlı olacak kadar yakın olabilir. Bu özel kullanım durumu, gelişmiş analitik veya eğitim makine öğrenimi modelleri bile olabilir.

Klasik "anonimleştirme" her zaman en iyi çözüm değildir, çünkü:

  1. Gizlilik riski - her zaman sahip olacaksın
    gizlilik riski. Bunları uygulamak
    klasik anonimleştirme teknikleri
    sadece zorlaştırır, ama değil
    kişileri tespit etmek imkansızdır.
  2. Verileri yok etme – daha çok sen
    anonimleştirin, daha iyi koruyun
    mahremiyetiniz, ancak siz ne kadar çok
    verilerinizi yok edin. bu ne değil
    analitik için istiyorsun, çünkü
    yok edilen veriler kötü sonuçlanacak
    anlayışlar.
  3. Zaman tükeniyor – bu bir çözümdür
    bu çok zaman alır, çünkü
    bu teknikler farklı çalışır
    veri kümesi ve veri türü başına.

Sentetik veriler, tüm bu eksiklikleri gidermeyi amaçlar. Fark o kadar çarpıcı ki bununla ilgili bir video yaptık. Izle burada.

Sık Sorulan Sorular

Sentetik Veriler

Genel olarak, müşterilerimizin çoğu sentetik verileri aşağıdakiler için kullanır:

  • Yazılım testi ve geliştirme
  • Analitik, model geliştirme ve gelişmiş analitik (AI ve ML) için sentetik veriler
  • Ürün demoları

Daha fazlasını okuyun ve kullanım örneklerini keşfedin.

Sentetik veri ikizi, gerçek dünyadaki bir veri kümesinin ve/veya veritabanının algoritma tarafından oluşturulmuş bir kopyasıdır. Sentetik Veri İkizi ile Syntho, orijinal veri setini veya veritabanını orijinal verinin gerçekçi bir temsilini oluşturmak için orijinal veriye mümkün olduğunca yakın taklit etmeyi amaçlar. Sentetik veri ikizi ile, orijinal verilere kıyasla üstün sentetik veri kalitesini hedefliyoruz. Bunu, son teknoloji yapay zeka modellerini kullanan sentetik veri yazılımımızla yapıyoruz. Bu AI modelleri, tamamen yeni veri noktaları oluşturur ve bunları, orijinal verilerin özelliklerini, ilişkilerini ve istatistiksel modellerini, orijinal verilermiş gibi kullanabileceğiniz ölçüde koruyacağımız şekilde modeller.

Bu, makine öğrenimi modellerini test etme ve eğitme, araştırma ve geliştirme için senaryoları simüle etme ve eğitim ve öğretim için sanal ortamlar oluşturma gibi çeşitli amaçlar için kullanılabilir. Sentetik veri ikizleri, mevcut olmadığında veya katı veri gizliliği düzenlemeleri nedeniyle gerçek dünya verilerinin kullanılması pratik veya etik olmadığında gerçek dünya verilerinin yerine kullanılabilecek gerçekçi ve temsili veriler oluşturmak için kullanılabilir.

Devamını oku.

Evet yaparız. Verilerinizi bir sonraki seviyeye taşımak için alaycılar da dahil olmak üzere çeşitli katma değerli sentetik veri optimizasyonu ve artırma özellikleri sunuyoruz.

Devamını oku.

Sahte veriler ve yapay zeka tarafından oluşturulan sentetik verilerin her ikisi de sentetik veri türleridir, ancak farklı şekillerde üretilirler ve farklı amaçlara hizmet ederler.

Sahte veriler, manuel olarak oluşturulan ve genellikle test ve geliştirme amacıyla kullanılan bir sentetik veri türüdür. Genellikle kontrollü bir ortamda gerçek dünya verilerinin davranışını simüle etmek için kullanılır ve genellikle bir sistem veya uygulamanın işlevselliğini test etmek için kullanılır. Genellikle basittir, oluşturulması kolaydır ve karmaşık modeller veya algoritmalar gerektirmez. Çoğu zaman, bir yönlendiren de sahte verileri "sahte veriler" veya "sahte veriler" olarak adlandırır.

Yapay zeka tarafından üretilen sentetik veriler ise makine öğrenimi veya üretken modeller gibi yapay zeka teknikleri kullanılarak üretilir. Sıkı gizlilik düzenlemeleri nedeniyle gerçek dünya verilerinin kullanılması pratik veya etik dışı olduğunda, gerçek dünya verilerinin yerine kullanılabilecek gerçekçi ve temsili veriler oluşturmak için kullanılır. Genellikle daha karmaşıktır ve manuel sahte verilere göre daha fazla hesaplama kaynağı gerektirir. Sonuç olarak, çok daha gerçekçidir ve orijinal verileri olabildiğince yakın taklit eder.

Özetle, sahte veriler manuel olarak oluşturulur ve genellikle test ve geliştirme için kullanılırken, yapay zeka tarafından üretilen sentetik veriler yapay zeka teknikleri kullanılarak oluşturulur ve temsili ve gerçekçi veriler oluşturmak için kullanılır.

Daha çok soru? uzmanlarımıza sorun

Veri kalitesi

Yapay verilerin orijinal verilerle aynı veri kalitesine sahip olmasını garanti etmek zor olabilir ve genellikle belirli kullanım durumuna ve sentetik verileri oluşturmak için kullanılan yöntemlere bağlıdır. Üretken modeller gibi sentetik veri üretmeye yönelik bazı yöntemler, orijinal verilere oldukça benzeyen veriler üretebilir. Anahtar soru: Bunu nasıl gösterebiliriz?

Sentetik verilerin kalitesini sağlamanın bazı yolları vardır:

  • Veri kalitesi raporumuz aracılığıyla veri kalitesi ölçümleri: Sentetik verilerin orijinal verilerle aynı veri kalitesine sahip olmasını sağlamanın bir yolu, sentetik verileri orijinal verilerle karşılaştırmak için veri kalitesi metriklerini kullanmaktır. Bu metrikler, verilerin benzerliği, doğruluğu ve eksiksizliği gibi şeyleri ölçmek için kullanılabilir. Syntho yazılımı, çeşitli veri kalitesi ölçümlerini içeren bir veri kalitesi raporu içeriyordu.
  • Dış değerlendirme: orijinal verilere kıyasla sentetik verilerin veri kalitesi kilit önemde olduğundan, yakın zamanda Syntho'nun sentetik verilerinin veri kalitesini gerçek verilerle karşılaştırarak göstermek için SAS'ın (analitikte pazar lideri) veri uzmanlarıyla bir değerlendirme yaptık. SAS analitik uzmanı Edwin van Unen, çeşitli analitik (AI) değerlendirmeleri aracılığıyla Syntho'dan oluşturulan sentetik veri kümelerini değerlendirdi ve sonuçları paylaştı. Bu videonun kısa bir özetini buradan izleyin.
  • Kendiniz test etme ve değerlendirme: sentetik veriler, gerçek dünya verileriyle karşılaştırılarak veya makine öğrenimi modellerini eğitmek için kullanılarak ve performansları gerçek dünya verileriyle eğitilmiş modellerle karşılaştırılarak test edilebilir ve değerlendirilebilir. Sentetik verilerin veri kalitesini neden kendiniz test etmiyorsunuz? Bunun olanaklarını uzmanlarımıza buradan sorun

Yapay verilerin orijinal verilere %100 benzer olduğunu asla garanti edemeyeceğine dikkat etmek önemlidir, ancak belirli bir kullanım durumu için yararlı olacak kadar yakın olabilir. Bu özel kullanım durumu, gelişmiş analitik veya eğitim makine öğrenimi modelleri bile olabilir.

Evet öyle. Sentetik veriler, orijinal verilerde bulunduğunu bilmediğiniz kalıpları bile barındırır.

Ama sadece bizim sözümüze güvenmeyin. SAS'ın (analitikte küresel pazar lideri) analitik uzmanları, sentetik verilerimizin (AI) değerlendirmesini yaptı ve bunları orijinal verilerle karşılaştırdı. Meraklı? Bir şeyi izlemek tüm olay burada veya hakkında kısa versiyonu izleyin burada veri kalitesi.

Evet yaparız. Platformumuz, veritabanları ve dolayısıyla veri tabanındaki veri kümeleri arasındaki referans bütünlüğünün korunması için optimize edilmiştir.

Bunun hakkında daha fazla bilgi edinmek mi istiyorsunuz?

Doğrudan uzmanlarımıza sorun.

Gizlilik

Hayır yapmıyoruz. Syntho Engine'i şirket içinde veya docker aracılığıyla özel bulutunuzda kolayca devreye alabiliriz.

Hayır. Platformumuzu, müşterinin güvenilir ortamında kolayca devreye alınabilecek şekilde optimize ettik. Bu, verilerin müşterinin güvenilir ortamından asla ayrılmamasını sağlar. Müşterinin güvenilir ortamı için dağıtım seçenekleri "yerinde" ve "müşterinin bulut ortamında (özel bulut)" şeklindedir.

İsteğe bağlı: Syntho, "Syntho bulutunda" barındırılan bir sürümü destekler.

Hayır. Syntho Engine bir self servis platformudur. Sonuç olarak, Syntho Engine ile sentetik veri üretmek şu şekilde mümkündür: end-to-end Syntho hiçbir zaman verileri göremez ve işlemesi gerekmez.

Evet, bunu QA raporumuz aracılığıyla yapıyoruz.

 

Bir veri setini sentezlerken, kişilerin yeniden tanımlanamayacağını göstermek esastır. İçinde Bu videoyu, Marijn bunu göstermek için kalite raporumuzda yer alan gizlilik önlemlerini sunar.

Syntho'nun QA raporu üç tane içerir Endüstri standartı veri gizliliğini değerlendirmek için ölçümler. Bu ölçümlerin her birinin arkasındaki fikir şu şekildedir:

  • Sentetik veri (S) "mümkün olduğu kadar yakın" olmalı, ancak hedef verilere "çok yakın olmamalıdır" (T).
  • Rastgele seçilen uzatma verileri (H) “çok yakın” için ölçüt belirler.
  • A mükemmel çözüm tam olarak orijinal veriler gibi davranan, ancak daha önce görülmemiş (= H).

Hollanda Veri Koruma Kurumu tarafından özellikle vurgulanan kullanım durumlarından biri, test verileri olarak sentetik verilerin kullanılmasıdır.

Bu makalede daha fazlasını bulabilirsiniz.

Syntho Motoru

Syntho Engine, bir Docker kapsayıcısında gönderilir ve kolayca dağıtılabilir ve tercih ettiğiniz ortamınıza takılabilir.

Olası dağıtım seçenekleri şunları içerir:

  • Içi
  • Herhangi bir (özel) bulut
  • Başka herhangi bir ortam

Daha fazla.

Syntho, veritabanlarınız, uygulamalarınız, veri boru hatlarınız veya dosya sistemlerinizle kolayca bağlantı kurmanızı sağlar. 

Kaynak ortam (orijinal verilerin depolandığı yer) ve hedef ortam (sentetik verilerinizi yazmak istediğiniz yer) ile bağlantı kurabilmeniz için çeşitli tümleşik bağlayıcıları destekliyoruz. end-to-end entegre bir yaklaşım.

Desteklediğimiz bağlantı özellikleri:

  • Docker ile tak ve çalıştır
  • 20'den fazla veritabanı bağlayıcısı
  • 20'den fazla dosya sistemi bağlayıcısı

Daha fazla.

Doğal olarak, oluşturma süresi veritabanının boyutuna bağlıdır. Ortalama olarak, 1 milyondan az kayda sahip bir tablo 5 dakikadan daha kısa sürede sentezlenir.

Syntho'nun makine öğrenimi algoritmaları, daha fazla varlık kaydıyla özellikleri daha iyi genelleştirebilir ve bu da gizlilik riskini azaltır. En az 1:500 sütun-sıra oranı önerilir. Örneğin, kaynak tablonuz 6 sütun içeriyorsa minimum 3000 satır içermelidir.

Hiç de bile. Sentetik verilerin avantajlarını, işleyişini ve kullanım durumlarını tam olarak anlamak biraz çaba gerektirse de, sentezleme süreci çok basittir ve temel bilgisayar bilgisine sahip herkes bunu yapabilir. Sentezleme süreci hakkında daha fazla bilgi için bkz. bu sayfa or demo istemek.

Syntho Engine, yapılandırılmış, tablo şeklindeki verilerde (satırlar ve sütunlar içeren herhangi bir şey) en iyi şekilde çalışır. Bu yapılar içinde aşağıdaki veri türlerini destekliyoruz:

  • Tablolarda biçimlendirilmiş verileri yapılandırır (kategorik, sayısal vb.)
  • Doğrudan tanımlayıcılar ve PII
  • Büyük veri kümeleri ve veritabanları
  • Coğrafi konum verileri (GPS gibi)
  • Zaman serisi verileri
  • Çok tablolu veritabanları (referans bütünlüğü ile)
  • Metin verilerini aç

 

Karmaşık veri desteği
Tüm normal tablo veri türlerinin yanında Syntho Engine, karmaşık veri türlerini ve karmaşık veri yapılarını destekler.

  • Zaman serisi
  • Çok tablolu veritabanları
  • Açık metin

Daha fazla.

Hayır, platformumuzu veri doğruluğundan ödün vermeden hesaplama gereksinimlerini en aza indirecek şekilde optimize ettik (örn. GPU gerektirmez). Ek olarak, büyük veritabanlarını sentezleyebilmeniz için otomatik ölçeklendirmeyi destekliyoruz.

Evet. Syntho yazılımı, birden çok tablo içeren veritabanları için optimize edilmiştir.

Buna gelince, Syntho veri doğruluğunu en üst düzeye çıkarmak için veri türlerini, şemaları ve formatları otomatik olarak algılar. Çok tablolu veritabanı için, bilgi tutarlılığını korumak için otomatik tablo ilişkisi çıkarımını ve sentezini destekliyoruz.

gülümseyen bir grup insan

Veriler sentetiktir ancak ekibimiz gerçektir!

Syntho ile iletişim kurun ve uzmanlarımızdan biri, sentetik verilerin değerini keşfetmek için ışık hızında sizinle iletişime geçecek!