Door: Harmen
De verkiezing van Trump heeft wereldwijd grote gevolgen, niet in de laatste plaats voor organisaties die (gevoelige) data verwerken. Hoe dit ons raakt en wat we kunnen doen…
Klanten stellen ons vaker de vraag: hoe houden we onze data veilig, weg van (bijvoorbeeld) de overheid van de Verenigde Staten? Tegelijkertijd krijgen we de vraag: hoe kunnen we zo snel mogelijk migreren naar de cloud, met name Microsoft Azure? Ons antwoord? Kijk naar de Europese cloud én wees ook ten alle tijden voorbereid op een snelle verhuizing, mocht het nodig zijn.
Wat is het echte risico van data in de cloud?
Als het om datawarehousing gaat, horen we maar al te vaak dergelijke stelling als:
- Het is veiliger, want Microsoft/Google/AWS weet echt wel wat ze aan het doen zijn
- Het is goedkoper, want je kunt gebruik maken van de ‘economies of scale’
- Het datacentrum staat in Nederland, dus valt de data onder de Nederlandse wet
- Het is veilig, want we vinken ‘encryption at rest’ aan
Helaas, al deze stellingen zijn niet juist. Natuurlijk weten grote cloudaanbieders precies wat ze doen en zijn datalekken bijzonder slecht voor de reputatie. Daarom wordt veel geïnvesteerd in veiligheid van data-opslag en verwerking in de cloud. Dit geldt natuurlijk net zo goed voor de grote Europese cloudaanbieders zoals OVHcloud (Frankrijk) en StackIT (Duitsland). Maar het is een slecht idee om de beveiliging van je cloud volledig uit te besteden aan je cloudleverancier: één. verkeerd. geplaatst. vinkje. en al je data. staat. wereldwijd. publiek. beschikbaar. Echt. waar.
En qua kosten: goedkoper is het zeker niet, tenzij je heel precies je gebruik weet te optimaliseren. En daarvoor is inhoudelijke expertise een belangrijke eis, in tegenstelling tot de belofte dat de cloud alles juist eenvoudiger zou maken.
Veel cloudproviders hebben datacentra in Nederland of elders in de Europese Unie. Dat lijkt veilig, want de data staat op Europese grond. Om twee redenen is dit helaas een sprookje: data vliegt continue de hele wereld rond en blijft dus niet beperkt tot het datacentrum waar het in opgeslagen staat. Bovendien stelt de Amerikaanse overheid dat alle Amerikaanse bedrijven vallen onder de wetgeving van de V.S., dus moeten ze data -op verzoek- aanleveren. Omdat de belangen van cloudaanbieders bij de Amerikaanse overheid vrijwel altijd groter zijn dan die van Europese bedrijven of overheden, wordt vrijwel altijd gehoor gegeven aan dergelijke verzoeken.
De laatste stelling -het is veilig want encrypie staat aan- is misschien wel de meest gevaarlijke. In vrijwel elke cloudomgeving kun je je data middels encryptie beveiligen. Het is goed om te realiseren dat er onderscheid bestaat tussen encryption-in-transit (als data over het internet reist, wordt het beveiligd, zodat niemand het kan lezen) en encryption-at-rest (data die in de cloud opgeslagen staat, is met encryptie beveiligd). De eerste vorm van beveiliging is een no-brainer en helpt écht. Maar de tweede vorm van beveiliging is in grote mate een wassen neus: data die met encryptie beveiligd is, kan inderdaad niet door anderen gelezen worden. Maar om met de data te werken, moeten de encryptiesleutels vrijwel altijd opgeslagen worden bij de cloudaanbieder zelf. Het is een beetje alsof je een de Zware Jongens een loeizware metalen deur in je huis laat plaatsen, maar je geeft ze meteen ook de sleutel. Conclusie? Encryptie beschermt je vrijwel nooit volledig tegen overheden of softwareaanbieders die bij je data willen.
Dankzij Trump eindelijk aandacht voor ‘vendor lock-in’
Data stallen bij Amerikaanse aanbieders is dus duidelijk niet zo’n goed idee. Zijn de Europese cloudaanbieders een goed alternatief? Dat ligt er een beetje aan. Voor veel basale zaken zoals compute (serverkracht), databases (opslag van gestructureerde data) en data lakes (opslag van ongestructureerde data) kunnen Europese aanbieders uitstekend op tegen hun Amerikaanse concurrenten. Voor specifieke toepassingen kan het lastiger zijn, denk aan Azure Data Factory (applicatie waarmee je data uit bronsystemen kunt ontsluiten in een datawarehouse) is enkel -zoals de naam doet raden- bij Microsoft te verkrijgen. Dit dwingt je nu wel om na te denken over vendor lock-in.
Naast dataveiligheid speelt een ander issue: als je eenmaal je infrastructuur bij een aanbieder ondergebracht hebt, is het vrijwel onmogelijk om over te stappen naar een andere provider. Azure Data Factory werkt nét even anders dan Amazon’s Glue. Redshift en Google BigQuery werken net weer anders dan Microsoft Fabric. Kortom, vendor lock-in!
Cloudaanbieders weten dit. Ze lokken je met aantrekkelijke starttarieven want ze weten: eenmaal binnen, nooit meer weg. Bedrijven zoals Oracle en SAP staan bekend om deze handelswijze.
Twee oplossingen: portabiliteit en de Europese cloud
De belangrijkste oplossing tegen zowel vendor lock-in als dataveiligheid zit ‘m in de portabiliteit van het dataplatform dat we gebruiken. Een dataplatform is portable als het voldoet aan de volgende eisen:
- Het platform maakt geen gebruik van systemen die enkel bij één aanbieder beschikbaar zijn.
- Het is gemakkelijk om het platform tussen allerlei cloudplatformen te verplaatsen.
- Het is mogelijk om het platform ook on-premises te draaien.
Sta je op het punt om te investeren in een cloudplatform en vind je dataveiligheid en het voorkomen van vendor lock-in belangrijk? Let dan vooral op die bovenstaande punten. Twijfel je, schakel ons dan gerust in voor een onafhankelijk advies.
Technische deep-dive: hoe regel je portabiliteit technisch in?
Bij Datalab hebben we een 100% portable dataplatform ontwikkeld: Datalab Studio. Vanaf de eerste ontwikkeling stelden wij de harde eis: het moet draaien in Azure, maar ook bij Amazon, Google én on-premises. Dit realiseerden wij middels een aantal belangrijke voorwaarden:
- Alle applicaties werken in zogenaamde containers. Omdat dit een wereldwijde standaard is, kunnen we de containers in vrijwel alle cloud- en on-premises-omgevingen draaien.
- We hebben een duidelijke voorkeur voor open source-oplossingen, zoals Apache Nifi (als alternatief voor Azure Data Factory en Amazon Glue), Airflow (als alternatief voor Databricks), PostgreSQL (als alternatief voor Microsoft SQL Server), Metabase (als alternatief voor Power BI en Tableau), en talloze andere systemen.
Naast portabiliteit speelt de keuze voor de cloudprovider een belangrijke rol. Wij adviseren onze klanten steeds vaker om een Europese aanbieder, zoals de eerder genoemde OVHcloud of StackIT, te gebruiken. Als dit geen optie is, dan is het advies: zorg dat je voorbereid bent op een snelle verhuizing van je platform, bijvoorbeeld door de in het kader benoemde technieken toe te passen.
Rustig afwachten en hopen dat alles goed komt is er niet meer bij. Je bent vanuit de AVG verplicht om zorgvuldig om te gaan met data. Net zo goed als dat je niet de deuren van je serverruimte onbeheerd open laat staan, zou je ook de deuren tot je data niet open moeten laten staan.
Talloze organisaties, van overheden tot medische instellingen, die met hooggevoelige data werken, maken al gebruik van de advies- en/of implementatierol van Datalab. Weten of wij ook een goed alternatief kunnen bieden voor jouw datatechnische uitdagingen? Spar eens vrijblijvend met ons!