Drei Blaue Monitore mit Infrastruktur als Linien. Im Hintergrund Hochhäuser und ein Computerzahlencode. Alles in blau.

6 minute read

Die Herausforderungen der Softwareverteilung

February 16, 2021

Die Softwareentwicklung hängt immer mehr von externen Abhängigkeiten (Dependencies) ab und die Häufigkeit der Deployments nimmt zu. Beide Trends zusammen sind schon eine Anforderung an die bestehenden Infrastrukturen. Ein weiteres Element, das die Bereitstellung von Software in einen Netzwerkengpass verwandelt, ist die Verwendung zusammengesetzter (compounded) Artefakte. Und der vierte Trend, der gegen uns arbeitet, ist die rapide ansteigende Anzahl von Geräten die als Konsumenten in Frage kommen. Alle diese Trends zusammen sind eine Herausforderung für die Infrastruktur. Aber was könnten wir dagegen tun?

Keine Zeit oder Lust zu lesen?

Dann geht es hier zu der visuellen online Version auf meinem Youtube Kanal

Youtube – Die Herausforderungen der Softwareverteilung

Edge-Computing

Bevor wir uns die Beschleunigungsstrategien ansehen, werde ich den Begriff Edge oder besser Edge-Computing etwas erläutern, da dies in diesem Zusammenhang häufig verwendet wird.

Was ist Edge oder besser Edge-Computing?

Das Prinzip des Edge-Computing besagt, dass die Datenverarbeitung am Rand des Netzwerks stattfindet. Welches Gerät letztendlich für die Verarbeitung der Daten verantwortlich ist, kann je nach Anwendung und Umsetzung des Konzepts unterschiedlich sein.

Ein Edge-Gerät ist ein Gerät an der Netzwerkperipherie, das selbst Daten generiert, verarbeitet oder weiterleitet. Beispiele für Edge-Geräte sind Smartphones, autonome Fahrzeuge, Sensoren oder IoT-Geräte wie Feuermelder.

Ein Edge-Gateway wird zwischen dem Edge-Gerät und dem Netzwerk installiert. Es empfängt Daten von Edge-Geräten, die nicht in Echtzeit verarbeitet werden müssen, verarbeitet bestimmte Daten lokal oder selektiv und sendet die Daten an andere Dienste oder zentrale Rechenzentren. Edge-Gateways verfügen über drahtlose oder drahtgebundene Schnittstellen zu den Edge-Geräten und den Kommunikationsnetzwerken für private oder öffentliche Clouds.

Vorteile von Edge-Computing

Die Datenverarbeitung findet in der Nähe der Datenquelle statt, wodurch Übertragungs- und Antwortzeiten minimiert werden. Die Kommunikation ist nahezu in Echtzeit möglich. Gleichzeitig reduzieren sich der Datendurchsatz und die Bandbreitennutzung im Netzwerk, da nur bestimmte Daten, die nicht lokal verarbeitet werden sollen, an zentrale Rechenzentren übertragen werden müssen. Viele Funktionen können auch dann beibehalten werden, wenn das Netzwerk oder Teile des Netzwerks ausfallen – die Leistung von Edge-Computing lässt sich durch die Bereitstellung intelligenterer Geräte an der Netzwerkperipherie skalieren.

Nachteile von Edge-Computing

Edge-Computing bietet aufgrund der lokal begrenzten Datenspeicherung mehr Sicherheit. Dies ist jedoch nur dann der Fall, wenn für die dezentralen Geräte geeignete Sicherheitskonzepte verfügbar sind. Aufgrund der Heterogenität und vieler verschiedener Geräte steigt der Aufwand für die Implementierung der Sicherheitskonzepte.

Fog-Computing

Edge-Computing und Fog-Computing sind beide dezentrale Datenverarbeitungskonzepte. Fog-Computing fügt eine weitere Ebene mit den sogenannten Fog-Nodes zwischen den Edge-Geräten und der Cloud ein. Dies sind kleine lokale Rechenzentren in den Zugriffsbereichen der Cloud. Diese Nebelknoten sammeln die Daten von den Randgeräten. Sie wählen die Daten aus, die lokal oder dezentral verarbeitet werden sollen, und leiten sie an zentrale Server weiter oder verarbeiten sie direkt selbst. Wenn wir das Beste aus beiden Welten auswählen, kombinieren wir beide Prinzipien des Edge- und Fog-Computing.

Was sind die Beschleunigungsoptionen für die Software-Verteilung?

Es gibt verschiedene Strategien, um die Verteilung von Binärdateien zu skalieren, und jede Lösung passt zu einem bestimmten Anwendungsfall. Allerdings gibt es auch Umgebungen in denen nicht alle Möglichkeiten zur Verfügung stehen. Das kann die unterschiedlichsten Gründe haben, wie zum Beispiel nicht vorhandene Infrastruktur oder behördliche Vorschriften und Beschränkungen. Zusätzlich zu diesen Einschränkungen möchte ich die Notwendigkeit von Hybridlösungen hervorheben. Zu den Hybridlösungen gehören lokale Ressourcen sowie eine Infrastruktur mit air-gab, die für Hochsicherheitsumgebungen verwendet werden.

a) Benutzerdefinierte Lösung basierend auf Replikations- oder Skalierungsservern

Eine Möglichkeit zur Skalierung innerhalb Ihres Netzwerks / Ihrer Architektur besteht darin, die Hardware zu skalieren und mit der direkten Replikation zu arbeiten. Wenn Sie dies selbst implementieren, wird höchstwahrscheinlich ein höheres Budget an Arbeitskräften, Wissen, Zeit und Geld verbraucht, da dies kein triviales Projekt ist. Gleichzeitig ist dieser Ansatz an die Grenzen der Infrastruktur gebunden, auf die Sie Zugriff haben.

b) P2P-Netzwerke

Der Peer-to-Peer-Ansatz impliziert, dass Sie eine Reihe von Kopien Ihrer Dateien haben. Wenn Sie eine Datei aus dem Netzwerk herunterladen, können alle Knoten Teile unabhängig voneinander bereitstellen. Dieser Ansatz, Dateien aufzuteilen und gleichzeitig von verschiedenen Knoten an den anfordernden Knoten zu liefern, führt zu einer konstanten und effizienten Netzwerknutzung und reduzierten Downloadzeiten.

c) CDN – Content-Delivery-Network

CDNs sind optimiert, um große Dateien über Regionen hinweg zu liefern. Das Netzwerk selbst besteht aus einer großen Anzahl von Knoten, die Dateien für die regionale Bereitstellung zwischenspeichern. Mit dieser Strategie wird der ursprüngliche Server signifikant entlastet.

Schauen Sie sich auf meinem Youtube-Kanal

das Video DevSecOps – Low hanging Fruits an.
Dieses Video beschreibt das Verhältnis zwischen dem eigenen Quelltexten und den

hinzugefügten Abhängigkeiten und was dies für DevSecOps bedeutet.

Youtube – DevSecOps – Niedrig hängende Früchte

Die JFrog-Lösung

Mit den drei genannten Techniken können Sie eine riesige und leistungsstarke Architektur aufbauen, die Ihren Anforderungen entspricht. Die Integration all dieser Technologien und die Implementierung von Produkten ist jedoch nicht einfach. JFrog hat im Laufe der Jahre Lösungen gefunden und in eine DevSecOps-Plattform namens The JFrog Platform integriert. In diesem Artikel möchte ich mich auf die Komponenten konzentrieren, die nur für die Verteilung der Binärdateien verantwortlich sind.

JFrog-Distribution

Bei der JFrog-Verteilung wird das Wissen über den Inhalt der Repositories und die entsprechenden Metadaten verwendet, um eine Replikationsstrategie bereitzustellen. Die Replikationslösung wurde für interne und externe Repositories entwickelt, um die Binärdateien an den Ort zu bringen, an dem sie benötigt werden. Die Infrastruktur kann in einem Hybridmodell aufgebaut werden, einschließlich On-Prem- und Cloud-Knoten. Mit Import- / Exportmechanismen sind sogar Lösungen mit air-gap möglich. In diesem Szenario jedoch konzentrieren wir uns auf einen skalierbaren Caching-Mechanismus, der für Lesevorgänge optimiert ist.

Was ist ein Release-Bundle?

Ein Release-Bundle besteht aus Binärdateien. Diese Binärdateien können von unterschiedlicher Art sein, z. B. Maven, Debian oder Docker. Das Release-Bundle kann als Stückliste (BOM – Bills of Material) angesehen werden. Der Inhalt und die Release-Bundles selbst sind unveränderlich. Diese Unveränderlichkeit ermöglicht die Implementierung effizienter Caching- und Replikationsmechanismen in verschiedenen Netzwerken und Regionen.

Was ist in diesem Zusammenhang ein Edge-Node?

Ein Edge-Knoten ist in unserem Kontext ein Knoten, der die Funktionalität einer schreibgeschützten Artifactory-Instanz bereitstellt. Mit diesem Edge-Knoten wird der Übermittlungsprozess optimiert, und wir werden sehen, dass die Replikation auf transaktionale Weise erfolgt. Der Unterschied zur ursprünglichen Bedeutung eines Edge-Nodes besteht darin, dass diese Instanz nicht das konsumierende oder produzierende Element ist. Dies kann als Fog-Node angesehen werden, beziehungsweise die erste Schicht über der Ebene der realen Konsumenten.

P2P-Download

Die P2P-Lösung konzentriert sich auf Umgebungen, die Download-Bursts innerhalb desselben Netzwerks oder derselben Region verarbeiten müssen. Diese Download-Bursts können Szenarien wie Aktualisieren einer Serverfarm oder Aktualisieren eines Microservice-Netzes sein. Die Verwendung ist unidirektional, was bedeutet, dass der Verbraucher nicht von seiner Seite aus aktualisiert, sondern lediglich konsumiert. Sie warten nur auf eine neue Version und alle Verbraucher aktualisieren gleichzeitig. Diese Anforderung ist perfekt für die P2P-Lösung.

Der Verbraucher selbst fordert die Binärdatei vom P2P-Knoten und nicht mehr von der Artifactory-Instanz an.
Die verantwortliche Artifactory-Instanz verwaltet die P2P-Knoten. Beachten Sie, dass der RBAC auch an den P2P-Knoten aktiv ist.

CDN-Verteilung

Die CDN-Lösung ist optimiert, um Binärdateien in verschiedene Teile der Welt zu liefern. Dieses gibt es in zwei verschiedenen Ausprägungen. Eine ist für die Öffentlichkeit bestimmt und wird hauptsächlich zum Verteilen von SDKs, Treibern oder anderen frei verfügbaren Binärdateien verwendet. Die andere Variante konzentriert sich auf die Bereitstellung in einem privaten Umfeld.
Unabhängig davon, welche Lösung Sie verwenden, wird der im Zugriffsmodul definierte RBAC eingehalten, einschließlich Lösungen mit Authentifizierung und Autorisierung sowie eindeutiger Links mit integriertem Zugriffstoken.

Fazit

Mit der zunehmenden Anzahl von Abhängigkeiten, einer höheren Häufigkeit von Bereitstellungen und der ständig wachsenden Anzahl von Anwendungen und Edge-Nodes stehen wir vor Herausforderungen hinsichtlich der Skalierbarkeit.

Drei Möglichkeiten, wie Sie Ihre Wertschöpfungskette an dieser Stelle erhöhen können:

Die gezeigte Lösung basiert auf

a) JFrog Distribution hilft Ihnen beim Aufbau einer starken Replikationsstrategie innerhalb Ihrer Hybridinfrastruktur, um den Entwicklungszyklus zu beschleunigen.

b) JFrog P2P, mit dem Sie massive Download-Bursts innerhalb eines Netzwerks oder einer Region verarbeiten können. Diese Lösung eignet sich für Aufgaben, bei denen Binärdateien während Download-Bursts gleichzeitig an eine große Anzahl von Verbrauchern lokal verteilt werden müssen.

c) JFrog CDN liefert Binärdateien weltweit in regionale Rechenzentren, was zu einer globalen Caching-Struktur führt.

Alles zusammen ist in der JFrog-Platform gebündelt. Natürlich kann man auch diese Strukturen aus einzelnen Komponenten selber abbilden. Hier sollte man allerdings die daraus resultierenden Aufwände genau gegenrechnen.

Cheers

Sven Ruppert

Sven Ruppert entwickelt seit 1996 in Java an Industrieprojekten. Er war über 15 Jahre als Berater weltweit in Branchen wie Automobil, Raumfahrt, Versicherungen, Bankwesen, UNO und WorldBank tätig.

Sven ist Groundbreaker Ambassador (ehem. Oracle Developer Champion) und arbeitet als Developer-Advocate für JFrog. Er spricht regelmäßig auf Konferenzen weltweit und schreibt für IT-Zeitschriften sowie Tech-Portalen.

Neben seinem Hauptthema DevSecOps und den Evergreen-Themen Core-Java und Kotlin arbeitet er an Mutationstests von Web-Apps und Distributed UnitTesting.

General

DevSecOps – 101

January 28, 2021

Delegation versus Inheritance in grafischen Oberflächen

March 16, 2021

Discover more

Articles

Markus Kett

July 23, 2018

JAVAPRO Meetup-Reihe 2018

JAVAPRO

January 17, 2022

Training Videos

Users Don’t Have to Suffer in the Cloud | Melissa Jurkoic (EN)

Markus Kett

February 25, 2019

Neun Best-Practices für Container

Pierre Gronau

May 17, 2022

Cookie	Duration	Description
__cf_bm	1 hour	This cookie, set by Cloudflare, is used to support Cloudflare Bot Management.
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Advertisement" category.
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
CookieLawInfoConsent	1 year	CookieYes sets this cookie to record the default button state of the corresponding category and the status of CCPA. It works only in coordination with the primary cookie.
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
wpEmojiSettingsSupports	session	WordPress sets this cookie when a user interacts with emojis on a WordPress site. It helps determine if the user's browser can display emojis properly.

Cookie	Duration	Description
mailchimp_landing_site	1 month	MailChimp sets the cookie to record which page the user first visited.
wordpress_google_apps_login	session	This is a functional cookie used for WordPress.This cookie allows the users to login to the site with their Google account.

Cookie	Duration	Description
_clck	1 year	Microsoft Clarity sets this cookie to retain the browser's Clarity User ID and settings exclusive to that website. This guarantees that actions taken during subsequent visits to the same website will be linked to the same user ID.
_clsk	1 day	Microsoft Clarity sets this cookie to store and consolidate a user's pageviews into a single session recording.
_ga	1 year 1 month 4 days	Google Analytics sets this cookie to calculate visitor, session and campaign data and track site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognise unique visitors.
_ga_*	1 year 1 month 4 days	Google Analytics sets this cookie to store and count page views.
_gat_gtag_UA_*	1 minute	Google Analytics sets this cookie to store a unique user ID.
_gid	1 day	Google Analytics sets this cookie to store information on how visitors use a website while also creating an analytics report of the website's performance. Some of the collected data includes the number of visitors, their source, and the pages they visit anonymously.
CLID	1 year	Microsoft Clarity set this cookie to store information about how visitors interact with the website. The cookie helps to provide an analysis report. The data collection includes the number of visitors, where they visit the website, and the pages visited.
MR	7 days	This cookie, set by Bing, is used to collect user information for analytics purposes.
SM	session	Microsoft Clarity cookie set this cookie for synchronizing the MUID across Microsoft domains.

Cookie	Duration	Description
ANONCHK	10 minutes	The ANONCHK cookie, set by Bing, is used to store a user's session ID and verify ads' clicks on the Bing search engine. The cookie helps in reporting and personalization as well.
MUID	1 year 24 days	Bing sets this cookie to recognise unique web browsers visiting Microsoft sites. This cookie is used for advertising, site analytics, and other operations.

Hand-Picked Top-Read Stories

Executive Order und der Solarwinds Hack – Was bedeutet das für uns?

Trending Tags

Die Herausforderungen der Softwareverteilung

Edge-Computing

Was ist Edge oder besser Edge-Computing?

Vorteile von Edge-Computing

Nachteile von Edge-Computing

Fog-Computing

Was sind die Beschleunigungsoptionen für die Software-Verteilung?

a) Benutzerdefinierte Lösung basierend auf Replikations- oder Skalierungsservern

b) P2P-Netzwerke

c) CDN – Content-Delivery-Network

Die JFrog-Lösung

JFrog-Distribution

Was ist ein Release-Bundle?

Was ist in diesem Zusammenhang ein Edge-Node?

P2P-Download

CDN-Verteilung

Fazit

Previous Post

DevSecOps – 101

Next Post

Delegation versus Inheritance in grafischen Oberflächen

JAVAPRO Meetup-Reihe 2018

Users Don’t Have to Suffer in the Cloud | Melissa Jurkoic (EN)

Neun Best-Practices für Container

PCI-DSS 4.0 endlich am Start

Executive Order und der Solarwinds Hack – Was bedeutet das für uns?

Cybersecurity – Was ist SAST, DAST, IAST und RASP? – ein kleines Intro

Sign Up

To Our Weekly Newsletter

Die Herausforderungen der Softwareverteilung

Edge-Computing

Was ist Edge oder besser Edge-Computing?

Vorteile von Edge-Computing

Nachteile von Edge-Computing

Fog-Computing

Was sind die Beschleunigungsoptionen für die Software-Verteilung?

a) Benutzerdefinierte Lösung basierend auf Replikations- oder Skalierungsservern

b) P2P-Netzwerke

c) CDN – Content-Delivery-Network

Die JFrog-Lösung

JFrog-Distribution

Was ist ein Release-Bundle?

Was ist in diesem Zusammenhang ein Edge-Node?

P2P-Download

CDN-Verteilung

Fazit

Previous Post

Next Post

JAVAPRO Meetup-Reihe 2018

Users Don’t Have to Suffer in the Cloud | Melissa Jurkoic (EN)

Neun Best-Practices für Container

PCI-DSS 4.0 endlich am Start

Related Posts

Sign Up

To Our Weekly Newsletter