fliegen & 7Wochen
This commit is contained in:
parent
74085dacf3
commit
eb19e3a43a
80
fliegen/fliegen.sql
Normal file
80
fliegen/fliegen.sql
Normal file
@ -0,0 +1,80 @@
|
||||
-- Views und Trigger
|
||||
-- SQL Tabellen
|
||||
|
||||
-- Tabelle Pilot
|
||||
|
||||
CREATE TABLE pilot (
|
||||
personalnr INTEGER PRIMARY KEY,
|
||||
name VARCHAR NOT NULL,
|
||||
alter INTEGER,
|
||||
flugstunden NUMERIC
|
||||
);
|
||||
|
||||
-- Tabelle Flugszeugtype
|
||||
|
||||
CREATE TABLE flugzeugtyp (
|
||||
typbezeichnung VARCHAR PRIMARY KEY,
|
||||
reisegeschwindigkeit NUMERIC,
|
||||
typflugstunden NUMERIC
|
||||
);
|
||||
|
||||
-- Tabelle Fliegt
|
||||
|
||||
CREATE TABLE fliegt (
|
||||
personalnr INTEGER REFERENCES pilot(personalnr),
|
||||
typbezeichnung VARCHAR REFERENCES flugzeugtyp(typbezeichnung),
|
||||
fliegtflugstunden NUMERIC,
|
||||
PRIMARY KEY(personalnr, typbezeichnung)
|
||||
);
|
||||
|
||||
-- Befüllen der Tabellen pilot und flugzeugtyp
|
||||
|
||||
INSERT INTO pilot (personalnr, name, alter, flugstunden) VALUES (1007, 'James', 44, 20012);
|
||||
INSERT INTO pilot (personalnr, name, alter, flugstunden) VALUES (1008, 'Zoe', 33, 10020);
|
||||
|
||||
INSERT INTO flugzeugtyp (typbezeichnung, reisegeschwindigkeit, typflugstunden) VALUES ('Airbus A320', 800, 50821);
|
||||
INSERT INTO flugzeugtyp (typbezeichnung, reisegeschwindigkeit, typflugstunden) VALUES ('Airbus A370', 800, 20312);
|
||||
INSERT INTO flugzeugtyp (typbezeichnung, reisegeschwindigkeit, typflugstunden) VALUES ('Boing B737', 800, 30021);
|
||||
|
||||
-- View
|
||||
|
||||
CREATE VIEW pflugstunden AS
|
||||
SELECT personalnr, name , SUM (flugstunden)
|
||||
FROM pilot
|
||||
GROUP BY personalnr, name;
|
||||
|
||||
CREATE VIEW typflugstunden AS
|
||||
SELECT typbezeichnung, SUM (typflugstunden)
|
||||
FROM flugzeugtyp
|
||||
GROUP BY typbezeichnung;
|
||||
|
||||
SELECT *
|
||||
FROM pflugstunden;
|
||||
|
||||
-- Trigger
|
||||
|
||||
CREATE OR REPLACE FUNCTION AktualisiereFlugstunden ( ) RETURNS TRIGGER AS
|
||||
'
|
||||
BEGIN
|
||||
-- aktualisiere die Flugstunden des Piloten
|
||||
|
||||
UPDATE pilot SET flugstunden = flugstunden + NEW.fliegtflugstunden WHERE personalnr = NEW.personalnr;
|
||||
|
||||
-- aktualisiere die Flugstunden des Flugzeugtyps
|
||||
|
||||
UPDATE flugzeugtyp SET typflugstunden = typflugstunden + NEW.fliegtflugstunden WHERE typbezeichnung = NEW.typbezeichnung;
|
||||
|
||||
RETURN NEW;
|
||||
|
||||
END;
|
||||
' LANGUAGE 'plpgsql';
|
||||
|
||||
CREATE TRIGGER pflugstunden
|
||||
AFTER INSERT ON fliegt
|
||||
FOR EACH ROW EXECUTE PROCEDURE AktualisiereFlugstunden ( );
|
||||
|
||||
|
||||
INSERT INTO fliegt (personalnr, typbezeichnung, fliegtflugstunden) VALUES (1007, 'Airbus A320', 10000);
|
||||
|
||||
SELECT *
|
||||
FROM pflugstunden;
|
||||
25
fuzzy_volltext_mehrdimensionales/create_movies.sql
Normal file
25
fuzzy_volltext_mehrdimensionales/create_movies.sql
Normal file
@ -0,0 +1,25 @@
|
||||
CREATE TABLE genres (
|
||||
name text UNIQUE,
|
||||
position integer
|
||||
);
|
||||
|
||||
CREATE TABLE movies (
|
||||
movie_id SERIAL PRIMARY KEY,
|
||||
title text,
|
||||
genre cube
|
||||
);
|
||||
|
||||
CREATE TABLE actors (
|
||||
actor_id SERIAL PRIMARY KEY,
|
||||
name text
|
||||
);
|
||||
|
||||
CREATE TABLE movies_actors (
|
||||
movie_id integer REFERENCES movies NOT NULL,
|
||||
actor_id integer REFERENCES actors NOT NULL,
|
||||
UNIQUE (movie_id, actor_id)
|
||||
);
|
||||
|
||||
CREATE INDEX movies_actors_movie_id ON movies_actors (movie_id);
|
||||
CREATE INDEX movies_actors_actor_id ON movies_actors (actor_id);
|
||||
CREATE INDEX movies_genres_cube ON movies USING gist (genre);
|
||||
19040
fuzzy_volltext_mehrdimensionales/movies_data.sql
Normal file
19040
fuzzy_volltext_mehrdimensionales/movies_data.sql
Normal file
File diff suppressed because it is too large
Load Diff
@ -0,0 +1,154 @@
|
||||
-- postgreSQL Volltext und Mehrdimensionales
|
||||
-- Volltext --------Intro ergänzen ---------
|
||||
-- Als eine Übung zum Spielen mit Multidimensionalität sehen wir uns die cube extension (https://www.postgresql.org/docs/current/cube.html) in postgreSQL an.
|
||||
-- Als Grundlage dient uns das Buch "7 Wochen, 7 Datenbanken" auf den Seiten 39 bis 41 (Vorbereitung), 41-51 (Volltext) und 51-53 (Mehrdimensionales).
|
||||
|
||||
-------------------------------------------------
|
||||
-- Zunächst in PostgeSQL eine neue Datenbank mit dem Namen "7Wochen" anlegen.
|
||||
-- dort zunächst die notwendigen Extensions einbinden.
|
||||
-- Sollten bestimmte extensions in der Installation nicht vorhanden sein müssen diese zunächst in folgendes Verzeichnis kopiert werden: ...\PostgreSQL\17\share\extension
|
||||
-- Der Befehle zum Hinterlegen der extensions lauten (Query Tool benutzen):
|
||||
CREATE EXTENSION
|
||||
IF NOT EXISTS
|
||||
tablefunc;
|
||||
CREATE EXTENSION
|
||||
IF NOT EXISTS
|
||||
dict_xsyn;
|
||||
CREATE EXTENSION
|
||||
IF NOT EXISTS
|
||||
fuzzystrmatch;
|
||||
CREATE EXTENSION
|
||||
IF NOT EXISTS
|
||||
pg_trgm;
|
||||
CREATE EXTENSION
|
||||
IF NOT EXISTS
|
||||
cube;
|
||||
|
||||
-------------------------------------------------
|
||||
-- Anlegen der nötigen Tabellen:
|
||||
-- Hierzu verwenden wir die Datei create_movies.sql, die in Moodle zu finden ist.
|
||||
|
||||
-------------------------------------------------
|
||||
-- Als nächstes müssen die Tabellen befüllt werden.
|
||||
-- Hierzu verwenden wir die Datei movies_data.sql, die in Moodle zu finden ist.
|
||||
-- Nun ist alles bereit und wir können die Aufgaben durchgehen.
|
||||
|
||||
-------------------------------------------------
|
||||
-- Volltext
|
||||
-- Genauere Beschreibungen im Buch Seiten 41-51
|
||||
|
||||
-- UNSCHARFE SUCHE
|
||||
|
||||
-- LIKE und ILIKE
|
||||
SELECT title FROM movies WHERE title ILIKE 'stardust%';
|
||||
|
||||
SELECT title FROM movies WHERE title ILIKE 'stardust_%';
|
||||
|
||||
-- Reguläre Ausdrücke
|
||||
-- ~ Regulärer Ausdruck, hier 'the', ^ steht für am Anfang und .* entspricht dem % aus LIKE, also eine beliebige Kette von Zeichen.
|
||||
-- ! steht für "nicht" und * für "schreibungsunabhängig, also nicht case sensitive.
|
||||
SELECT COUNT(*) FROM movies WHERE title !~* '^the.*';
|
||||
-- oder
|
||||
SELECT title FROM movies WHERE title !~* '^the.*';
|
||||
|
||||
-- Levenshtein (extension: fuzzystrmatch)
|
||||
SELECT levenshtein('bat', 'fads');
|
||||
|
||||
SELECT levenshtein('bat', 'fad') fad,
|
||||
levenshtein('bat', 'fat') fat,
|
||||
levenshtein('bat', 'bat') bat;
|
||||
|
||||
SELECT movie_id, title
|
||||
FROM movies
|
||||
WHERE levenshtein(lower(title), lower('a hard day nght')) <= 3;
|
||||
|
||||
-- Trigramm (extension: pg_trgm)
|
||||
|
||||
SELECT show_trgm('Avatar');
|
||||
|
||||
CREATE INDEX movies_title_trigram ON movies
|
||||
USING gist (title gist_trqm_ops);
|
||||
|
||||
SELECT title
|
||||
FROM movies
|
||||
WHERE title % 'Avatre';
|
||||
|
||||
-- VOLLTEXTSUCHE
|
||||
|
||||
-- TSVector, TSQuery
|
||||
SELECT title
|
||||
FROM movies
|
||||
WHERE title @@ 'night & day';
|
||||
-- Beispiel für Aufteilung in Vectoren und Queries:
|
||||
SELECT to_tsvector('A Hard Day''s Night'), to_tsquery('english', 'night & day');
|
||||
|
||||
-- Beispiel für Anpassungen der Wörterbücher
|
||||
SELECT to_tsvector('english','A Hard Day''s Night');
|
||||
SELECT to_tsvector('simple','A Hard Day''s Night');
|
||||
|
||||
-- METAPHONE
|
||||
-- Erster Versuch
|
||||
SELECT *
|
||||
FROM actors
|
||||
WHERE name = 'Broos Wils';
|
||||
|
||||
-- Mit Hilfe von Triagramm
|
||||
SELECT *
|
||||
FROM actors
|
||||
WHERE name % 'Broos Wils';
|
||||
|
||||
-- Mit Metaphone, 6 ist hier die Länge des Ausgabestrings in Lautsprache
|
||||
SELECT title
|
||||
FROM movies NATURAL JOIN movies_actors NATURAL JOIN actors
|
||||
WHERE metaphone(name, 6) = metaphone('Broos Wils', 6);
|
||||
|
||||
-- Beispiel für verschiedene Umwandlungen
|
||||
SELECT name, dmetaphone(name), dmetaphone_alt(name), metaphone (name, 8), soundex(name)
|
||||
FROM actors;
|
||||
|
||||
-- STRING-MATCHES KOMBINIEREN
|
||||
-- Beispiel:
|
||||
SELECT *
|
||||
FROM actors
|
||||
WHERE metaphone(name, 8) % metaphone('Robin Williams', 8)
|
||||
ORDER BY levenshtein(lower('Robin Williams'), lower(name));
|
||||
|
||||
|
||||
-------------------------------------------------
|
||||
-- Mehrdimensionales
|
||||
-- Genauere Beschreibungen im Buch Seiten 51-53
|
||||
|
||||
-- cube_ur_coord ist ein Befehl aus der cube-extension (https://www.postgresql.org/docs/current/cube.html)
|
||||
|
||||
-- Jeder movie hat also einen Wert bei insgesamt 18 genres
|
||||
|
||||
SELECT name, cube_ur_coord('(0,7,0,0,0,0,0,0,0,7,0,0,0,0,10,0,0,0)', position) as score
|
||||
FROM genres g
|
||||
WHERE cube_ur_coord('(0,7,0,0,0,0,0,0,0,7,0,0,0,0,10,0,0,0)', position) >0;
|
||||
|
||||
-- Hier werden Distanzen berechnet und danach sortiert
|
||||
SELECT *, cube_distance(genre, '(0,7,0,0,0,0,0,0,0,7,0,0,0,0,10,0,0,0)') dist
|
||||
FROM movies
|
||||
ORDER BY dist;
|
||||
|
||||
-- Beispiel cube_enlarge:
|
||||
-- Ausgangspunkt ist (1,1), es wird um 1 erweitert und das für 2 Dimensionen
|
||||
SELECT cube_enlarge('(1,1)', 1, 2);
|
||||
|
||||
-- Nun wird das ganze um die 18 genres aufgebaut mit einer Erweiterung um 5 in 18 dimensionen
|
||||
SELECT title, cube_distance(genre, '(0,7,0,0,0,0,0,0,0,7,0,0,0,0,10,0,0,0)') dist
|
||||
FROM movies
|
||||
WHERE cube_enlarge('(0,7,0,0,0,0,0,0,0,7,0,0,0,0,10,0,0,0)'::cube, 6,18) @> genre
|
||||
ORDER BY dist;
|
||||
|
||||
-- Hier wird nun noch eine Unterabfrage integriert, die es erlaubt über den Filmnamen zu suchen
|
||||
SELECT m.movie_id, m.title
|
||||
FROM movies m,
|
||||
(SELECT genre, title
|
||||
FROM movies
|
||||
WHERE title = 'Mad Max') s
|
||||
WHERE cube_enlarge(s.genre, 5, 18) @> m.genre AND s.title <> m.title
|
||||
ORDER BY cube_distance(m.genre, s.genre)
|
||||
LIMIT 10;
|
||||
|
||||
-- The end
|
||||
Loading…
x
Reference in New Issue
Block a user