Simulering och visualisering av en Eulerisk fluid p˚a grafikkortet

Transcript Simulering och visualisering av en Eulerisk fluid p˚a grafikkortet

ITN, Norrköping
20 mars 2011
Simulering och visualisering av en
Eulerisk fluid p˚a grafikkortet
M ODELLERINGS - OCH S IMULERINGSPROJEKT
TNM085
Medlemmar:
Christopher Birger
Henrik Bäcklund
Erik Englesson
Anders Hedblom
Per Karlsson
Kontakt:
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
Sammanfattning
Fluidsimuleringar blir allt vanligare när avancerad mjukvara driver h˚ardvaruutvecklingen fram˚at.
Att kunna modellera och simulera fluider som rök, vatten och eld har en stor betydelse inom
m˚anga omr˚aden, s˚a som film, spel och forskning, när det blir sv˚art eller omöjligt att använda
en riktig fluid.
Det finns givetvis olika sätt att genomföra detta p˚a, beroende p˚a vilket resultat som ska
uppn˚as – en grafiskt snygg men snabb simulering eller en mer realistisk s˚adan. Alla fluidsimuleringar bygger p˚a Navier-Stokes ekvation och det finns i princip tv˚a synsätt för att lösa
dessa. Antingen används partiklar (Langrageisk) eller s˚a diskretiseras fluiden p˚a ett rutnät
(Eulerisk). P˚a senare tid har man a¨ ven använt en kombination av dessa. I den Euleriska metoden
tittar man p˚a fixa punkter i rymden och hur fluidkvantiteter som hastighet och tryck a¨ ndrar sig
i tiden, istället för att följa partiklar. I den här rapporten implemeteras en Eulerisk lösning.
Eftersom vi har valt att simulera vatten behövs n˚agot sätt för att representera dess yta. Till detta
används level set-metoden.
Nämnda metoder a¨ r mycket beräkningstunga och har varit näst intill omöjlig att utföra i
realtid. Tack vare dagens kraftfulla grafikkort har det dock börjat bli fullt möjligt att simulera
och rendera en 3D-fluid i realtid.
Den här rapporten tar upp teori och tillvägag˚angssätt som använts för att skapa och visualisera
en vattenliknande fluid med den Eulariaska metoden p˚a datorns GPU. All kod a¨ r skriven av oss
själva och inga externa bibliotek har använts. Projektets grundutformning var att, i grupp, skapa
en modell av ett fysikaliskt fenomen och visualisera en simulering av denna. Arbetet hölls i
kursen TNM085 - Modellbygge och Simuleringsprojekt p˚a Linköpings universitet, v˚arterminen
2011.
Förord
Att fullfölja detta projekt har varit v˚ar största utmaning hittills, och motg˚angarna har varit
m˚anga. Eftersom idén med att simulera en Eulerisk fluid p˚a grafikkortet i realtid har blivit
beprövad av f˚a, har det varit sv˚art att f˚a tag p˚a svar till v˚ara fr˚agor.
Vi vill ge ett stort tack till PhD Andreas Söderström, som tog sig tid att ses och ge förklaringar
p˚a v˚ara fr˚ageställningar och göra projektet genomförbart p˚a s˚a kort tid.
Inneh˚allsförteckning
1
Inledning
1.1 Syfte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
2
Metod
2.1 Beteckningar . . . . . . . .
2.2 Begränsad rymd . . . . . . .
2.3 Interpolation . . . . . . . . .
2.4 Tidssteg . . . . . . . . . . .
2.5 Implementering . . . . . . .
2.5.1 GPU-programmering
2.5.2 Offline-rendering . .
2.5.3 Realtidssimulering .
2.6 Mjukvara . . . . . . . . . .
.
.
.
.
.
.
.
.
.
2
2
2
3
4
4
5
5
6
6
.
.
.
.
.
.
.
7
7
7
8
9
9
12
12
.
.
.
.
13
13
13
14
15
3
4
.
.
.
.
.
.
.
.
.
Grunderna hos en fluid
3.1 Navier-Stokes ekvation . . . .
3.2 Yttre krafter . . . . . . . . . .
3.3 Advektion . . . . . . . . . . .
3.4 Extrapolering av hastigheterna
3.5 Projektion . . . . . . . . . . .
3.6 Divergensfrihet . . . . . . . .
3.6.1 Dirichlets randvillkor .
Level set-metoden
4.1 Implicita ytor
4.2 β- och γ-band
4.3 Advektion . .
4.4 Reinitiering .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
Resultat
16
5.1 Realtid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.2 Utrenderat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6
Avslutning
18
6.1 Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
6.2 Vidare förbättringar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Litteraturförteckning
21
Figurer
2.1
2.2
2.3
2.4
Rymdens uppdelning i mindre voxlar. . . . . . . . . .
Definitionen av en MAC-ruta (Marker and Cell) i 2D.
Interpolation i 2D. . . . . . . . . . . . . . . . . . .
Transformation fr˚an 3D-textur till 2D. . . . . . . . .
3.1
En punkt sp˚aras ett tidsteg bak˚at med den bl˚a hastighetsvektorn. I den punkten
interpoleras en hastighet fram med hjälp av omkringliggande hastigheter (röda
vektorer). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Bild till exempel (3.17). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Bild p˚a innan och efter Dirichlets randvillkor uppfyllts . . . . . . . . . . . . . 12
3.2
3.3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
4
5
4.1
Allt inom den svarta gränsen a¨ r fluid. Det gröna fältet a¨ r β-band och det
streckade a¨ r γ-band. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.1
5.2
Resultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Resultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Kapitel 1
Inledning
Det finns m˚anga anledningar till varför man skulle vilja visualisera simuleringsbara modeller av
fluider. Specialeffekter till film, miljöer i spel eller avancerade tester inom andra industrier, bara
för att nämna n˚agra. Exempel p˚a effekter som g˚ar att a˚ terskapa väldigt bra med fluidsimuleringar
a¨ r rök och eld, men i det här projektet handlar det om att skapa vatten, med ett realistisk
utseende och beteende.
Det finns olika sätt p˚a hur man kan skapa en datorgenererad fluid. En metod som har blivit
omtyckt inom branschen för specialeffekter, a¨ r den partikelbaserade SPH-metoden (Smoothed
Particle Hydrodynamics). Den bygger p˚a att man har en stor mängd partiklar, var och en med
fysikaliska egenskaper som massa och kollisionshantering. En fördel med SPH a¨ r att metoden
ger ett visuellt tilltalande resultat i scener där det a¨ r mycket stänk. Ett problem a¨ r dock att en
SPH-fluid aldrig kan ligga riktigt still. Dess yta kommer att ha en konstant vibration. Därför
lämpar sig exemplevis inte SPH i en scen där vattnet ska ligga still.
Ett annat tillvägag˚angssätt a¨ r med den s˚a kallade Euleriska metoden. Den baserar sig p˚a
att, istället för att använda partiklar, beskriva fluiden med hjälp av en fix yttre domän uppdelad
i celler/voxlar. För att beskriva ytan används level set-metoden [1]. Det a¨ r den här metoden
som har använts i detta projekt, och dess olika steg och problem, som kan uppst˚a, beskrivs i
rapporten.
1.1
Syfte
Syftet med denna rapport a¨ r bland annat att:
¨ först˚aelsen för hur en fluid kan vara uppbyggd
• Oka
• Förklara den Euleriska metoden och värdefulla användningsomr˚aden för den
• Dokumentera för- och nackdelar med metoden
• Ge insikt i vilka problem som kan uppst˚a
1
Kapitel 2
Metod
2.1
Beteckningar
Beteckningar som används genom rapporten a¨ r:
Skalärer – gemener (t), Matriser – versaler (A), Vektorer/vektorfält – gemener med sträck (~u)
2.2
Begränsad rymd
För att kunna utföra alla numeriska beräkningar p˚a datorn m˚aste en begränsad rymd definieras
samt diskretiseras. Diskretisering utförs genom att volymen delas in i s˚a kallade voxlar (figur
2.1). Om en volym med dimensionerna 1x1x1m skall delas in i 64x64x64 voxlar f˚as en voxelstorlek,
∆h, p˚a 1/64 m. Finare diskretisering ger högre upplösning men flera beräkningar.
Varje voxel har en mittpunkt, sex sidor och 12 kanter med längden ∆h. I denna implementation
används ett s˚a kallat MAC-grid (Marker and Cell). Detta innebär att hastigheter sparas i mitten
av varje sida medan tryck sparas i mitten av varje voxel. Denna metod valdes d˚a precisionen i
uträkning av tryckgradienter samt divergens bli mer exakta [2].
2
Figur 2.1: Rymdens uppdelning i mindre voxlar.
Figur 2.2: Definitionen av en MAC-ruta (Marker and Cell) i 2D.
2.3
Interpolation
Ett problem som uppst˚ar vid en diskretisering som denna a¨ r att det enbart finns diskreta värden
med ett visst mellanrum att jobba med. Oftast kommer man bli tvungen att hämta värden som
inte finns i positionerna mellan de diskreta gränserna. En interpolation blir tvungen att utföras.
Det vill säga, värden runt omkring positionen i fr˚aga viktas och sl˚as ihop. Ett exempel p˚a enkel
linjär interpolation i tv˚a dimensioner kan ses i figur 2.3.
I tre dimensioner kan enkel trilinjär interpolation användas, men för ett mer korrekt värde
bör interpolation av högre ordning användas.
3
Figur 2.3: Interpolation i 2D.
I projektet används en Monoton Catmull-Rom-interpolation [3] som a¨ r av ordning tv˚a.
Detta a¨ r en kubisk interpolation som utnyttjar derivator vid viktningen. Dessa derivator tas
fram genom central differensapproximation.
2.4
Tidssteg
Tidssteget ∆t väljs s˚a att det garanterar ett CFL-tillst˚and (Courant-Friedrichs-Levy’s tillst˚and)
[1]:
∆h
(2.1)
∆t = k ·
max(ux + uy + uz )
Detta medför att information maximalt kan transporteras en voxel per tidssteg. Konstanten k
används för att skala tidsteget i (2.1). För att vara säker p˚a att CFL-tillst˚andet uppfylls bör k
ligga mellan noll och ett.
Ett problem som kan uppst˚a med detta stabilitetsvillkor a¨ r att när hastigheten hos fluiden
o¨ kar, sjunker tidssteget proportionellt mot denna. En mycket hög hastighet ger ett mycket litet
tidssteg. Det tar dock fortfarande lika l˚ang tid för datorn att utföra beräkningarna under ett
tidssteg.
2.5
Implementering
Hela arbetet a¨ r kodat med C++. CUDA C [4] har i sin tur använts för att kunna implementera
beräkningarna p˚a grafikkortets processor. Fluiden kan visuliseras antingen i realtid med hjälp
av OpenGL eller renderas ut offline. En iteration i fluidsimuleringen ser ut som följande:
1. Räkna ut ett tidssteg
2. Extrapolera hastighetsfältet i β-bandet
3. Lägg till externa krafter till hastighetsfältet
4. Advektera hastighetsfältet och level setet
4
5. Reinitisering av β- och γ-band
6. Lös tryckekvation för den nya fluiddomänen
7. Uppdatera hastighetsfältet genom att subtrahera tryckgradienten.
Stegen beskrivs i kapitel 3 och 4.
2.5.1
GPU-programmering
För att programmera instruktioner till grafikkortet har Nvidia CUDA använts som till˚ater mer
parallellism a¨ n vad en CPU gör. För att anropa en funktion (en s˚a kallad kernel) p˚a GPU’n,
körs koden parallellt o¨ ver block. Totalt kan ca 65 000 block köras, där varje block i sin tur kan
delas upp i tr˚adar. Antal tr˚adar beror p˚a grafikkortet och för att göra fluidlösaren kompatibel
med en större mängd grafikkort, används 256 tr˚adar per block. Nästan alla algoritmer körs
o¨ ver en specifik kvantitet (t.ex. hastigheter, tryck eller level set). Varje kernel anropas med
tillräckligt m˚anga block s˚a att varje tr˚ad f˚ar en egen cell/yta att arbeta med. CUDA till˚ater att
binda minnesplatser p˚a grafikkortet till en textur för snabb inläsning av data, det vill säga, om
data p˚a en minnesplats a¨ ndras s˚a kommer texturen dynamiskt att uppdateras. Användning av
texturer a¨ r ett kraftfullt verktyg d˚a lokalitet kan utnyttjas. Om ett texturvärde har lästs i en punkt,
g˚ar det snabbt att läsa i samma textur i närliggande punkter. Tyvärr g˚ar det inte i dagsläget att
dynamiskt skriva till 3D-texturer i CUDA, n˚agot som hade varit optimalt för en simulering i tre
dimensioner. Istället a¨ r den p˚atänkta 3D-texturen uppdelad i skivor som läggs ut som en enda
stor 2D-textur. Lokalitet bevaras d˚a fortfarande i tv˚a dimensioner men förloras i den dimension
som skivorna representerar.
Figur 2.4: Transformation fr˚an 3D-textur till 2D.
2.5.2
Offline-rendering
All offline-rendering a¨ r utförd i 3Ds Max, som f˚ar in en 3D-modell att jobba med. 3D-modellen
räknas ut för varje bildruta med metoden Marching cubes [5], där utvalda punkter i voxelrymden
används för att skapa polygoner.
5
2.5.3
Realtidssimulering
Med hjälp av str˚alar kan level setet renderas ut till skärmen. För att uppn˚a realtidssimulering
m˚aste denna process vara snabb, n˚agot som gör det sv˚art att sp˚ara str˚alar (raytracing) och f˚a en
fotorealistisk rendering. Istället implementeras en enkel raycaster som marscherar i en str˚ales
riktning genom level setet tills den träffat en punkt som ligger p˚a ytan [6]. Där används enkel
trilinjär interpolation av normaler för att f˚a mjuka o¨ verg˚angar mellan voxlar. Scenen renderas
med valfri shadingmetod (förslagsvis Phong-shading [7]) i tv˚a pass för att a˚ terge transparens
och refraktioner. I det första passet renderas omgivningen och den lagras i en textur. I det andra
passet renderas fluiden och beroende p˚a givet transparens-värde, interpoleras de tv˚a passens
renderingar. För att simulera refraktioner används en fusklösning som utnyttjar normalens
riktning mot kameran [8].
2.6
Mjukvara
• Microsoft Visual Studio 2010
• Autodesk 3Ds Max
• MATLAB
6
Kapitel 3
Grunderna hos en fluid
3.1
Navier-Stokes ekvation
För att kunna simulera en fluid behövs en modell som beskriver dess beteende matematiskt.
Modellen som används a¨ r den s˚a kallade Navier-Stokes-ekvationen (3.1) som inneh˚aller termerna
advektion, tryck, yttre krafter och viskositet.
1
∂~u
+ ~u · ∇~u + ∇~p = ~g + ν∇ · ∇~u
∂t
ρ
(3.1)
Ekvationen (3.1) m˚aste dock förenklas vid simulering. Den ska ocks˚a se till att fluidens volym
bevaras. Därför läggs ekvation (3.2) till som ett villkor p˚a att fluiden ska vara okomprimerbar
det vill säga att hastighetsfältet ska vara divergensfritt.
∇ · ~u = 0
(3.2)
En ytterligare förenkling p˚a Navier-Stokes-ekvationen a¨ r att ta bort viskositetstermen
(ν∇ · ∇~u) i beräkningarna. Detta p˚a grund av att den inte a¨ r viktig vid vattensimulering i och
med att de numeriska felen ger nog med viskositet a¨ nd˚a. De termer som a˚ terst˚ar kommer att
förklaras senare i rapporter.
Den sista förenklingen a¨ r att dela upp termerna i (3.1) och lösa de var för sig vilket kommer
underlätta beräkningarna. Detta benämns splitting.
3.2
Yttre krafter
För att fluiden ska kunna p˚averkas utifr˚an behövs delen i Navier-Stokes-ekvationen som behandlar
yttre krafter. Utan denna skulle fluiden aldrig röra p˚a sig. Yttre krafter kan innefatta t.ex.
gravitation eller vind. I det här projektet a¨ r den enda yttre kraften gravitation. Eftersom fluiden
inte har n˚agon virtuell massa kan vi se gravitationskraften som ren acceleration, som i sin
tur kan omvandlas till hastighet genom att integreras o¨ ver tiden. D˚a hela simuleringen sker i
diskreta steg f˚as den nya hastigheten genom ekvation (3.3), där ~g a¨ r gravitationen:
~un+1 = ~un + ~g · 4t
7
(3.3)
3.3
Advektion
Advektionsdelen i Navier-Stokes ekvation handlar om att propagera hastigheterna i hastighetsfältet.
När fluiden rör p˚a sig m˚aste hastighetsvektorerna, i de voxlar som fluiden sveper o¨ ver, f˚a nya
värden, s˚adana att fluiden beh˚aller sin hastighet. Rent matematiskt skulle det kunna ställas upp
som (3.4):
∂~qn
)
(3.4)
~qn+1 = advektera(~qn , 4t,
∂t
S˚a hur g˚ar det till? Plockas advektionsdelen ut ur (3.1) kan den ställas upp p˚a följande vis:
∂~un+1
= −(~un · ∇) · ~un
∂t
(3.5)
Eftersom hur sm˚a tidssteg som helst inte kan tas a¨ r det, i detta fall, inte lämpligt att använda sig
av vanlig Euler-integration d˚a metoden a¨ r instabil. Till slut skulle värden bli extremt felaktiga,
när tidssteget blir stort, och fluiden skulle inte längre bete sig normalt.
Vad som istället utförs a¨ r att en fiktiv partikel f˚ar sp˚aras ett tidssteg bak˚at i rymden. Den här
metoden a¨ r stabil för alla tidssteg och kallas Semi-Lagrangeisk metod [9] – semi, just för att
n˚agon verklig partikel aldrig skapas. D˚a metoden använder sig av tv˚a tidpunkter för att fungera,
krävs ocks˚a tv˚a kopior av hastighetsfältet; ett vars värden uppdateras, och används som sikte
bak˚at i tiden samt ett där gamla värden hämtas ifr˚an.
Figur 3.1: En punkt sp˚aras ett tidsteg bak˚at med den bl˚a hastighetsvektorn. I den punkten
interpoleras en hastighet fram med hjälp av omkringliggande hastigheter (röda vektorer).
Att bara g˚a ett enstaka steg bak˚at i tiden och plocka ett värde där a¨ r oftast inte särskilt
precist. För att o¨ ka precision har en integrationsmetod av högre ordning implementerats, Runge-Kutta
ordning 4. Men Eulers stegmetod ger vid bak˚atsteget ett acceptabelt resultat.
När en punkt bak˚at i tiden har identifierats gäller det att f˚a ut en hastighet fr˚an just den
punkten. Högst troligt a¨ r att en punkt ligger mellan voxelytor där hastigheter finns sparade,
vilket innebär att interpolation (se avsnitt 2.4) krävs.
För att f˚a ett a¨ nnu bättre resultat i advektionssteget används a¨ ven en metod som kallas
Back-and-Forth Error Compensation and Correction (BFECC) [10]. Vad detta innebär a¨ r att
hastigheten som används för att advektera bak˚at i tiden korrigeras med ett antal steg, enligt
8
ekvation (3.6).
φˆn+1 = Advektera(φn )
φˆn = Advektera−1 (φˆn+1 )
φn = (3φn − φˆn )/2
2
n+1
φ
(3.6)
= Advektera(φn2 )
Där φ a¨ r hastigheten som ska advekteras. Advektera−1 betyder att advektionen skall utföras
fram˚at i tiden istället för bak˚at.
3.4
Extrapolering av hastigheterna
En oklarhet kvarst˚ar; vad händer om advektionsdelen i (3.1) blir tillbedd att hämta ett värde
utanför fluiden, där inga hastigheten a¨ r definierade? Det innebär problem. Man vill allts˚a se
till att det alltid finns hastigheter en liten bit utanför fluidens yta. Hastigheter extrapoleras hela
tiden ut fr˚an fluiden s˚a att det alltid finns värden att plocka s˚a l˚angt ut som till gränsen p˚a
level setets β-band (se avsnitt 4.2). Vilka hastigheter som a¨ n befann sig utanför fluiden blir
o¨ verskrivna under extrapoleringen. Ekvation (3.7) används för att utföra detta repetitivt.
∂~u
= −ˆ
n · ∇~u
∂t
(3.7)
där ~u a¨ r hastighetsfältet och n
ˆ a¨ r normalerna till ytan. Detta kan kombineras med level setets
reinitiering (se avsnitt 4.4), som vet var de närmsta punkterna p˚a ytan finns och en hastighet
kan hämtas.
3.5
Projektion
Projektionen handlar om att lösa tryckdelen (3.8) av Navier-Stokes-ekvationen som gör hastighetsfältet
divergensfritt. Där högerledet i (3.8) best˚ar av densiteten ρ och tryckfältet p~. I det här tillst˚andet
har advektion samt externa krafter applicerats p˚a ~u. Projektionen a¨ r den beräkningstyngsta
delen av simuleringen i och med att trycket i vektorfältet a¨ ndras samtidigt som divergensvillkoret
(3.2) och randvillkoret ska uppfyllas.
1
~un+1 = ~u − ∆t ∇~p
ρ
(3.8)
Eftersom p~ i ekvation (3.8) a¨ r okänd m˚aste detta tryckfält bestämmas. Helmholtz-Hodge
dekomposition m˚aste utnyttjas vilken säger att ett vektorfält kan delas upp i ett divergensfritt
samt rotationsfritt fält.
~u = ~ud + k∇~p
(3.9)
Där ~ud i a¨ r den divergensfria delen och ∇~p a¨ r den rotationsfria delen i ekvation (3.9). B˚ade
~ud och ∇~p a¨ r okända. Om vi l˚ater divergensoperatorn operera p˚a (3.9) f˚as:
∇ · ~u = ∇ · ~ud + k∇2 p~ = k∇2 p~
(3.10)
Eftersom den okända ~ud termen a¨ r divergensfri förkortas den bort fr˚an ekvation (3.10) och
nu kan p~ lösas ut.
9
∆t 2
∇ p~ = ∇ · ~u
(3.11)
ρ
Nästa steg a¨ r att lösa Poissons ekvationen (3.11). För att kunna göra det numeriskt m˚aste
ekvationen diskretiseras och vi börjar med högerledet som visas i ekvation (3.12) där u, v, w a¨ r
x-, y- och z-komponenterna för vektorerna i vektorfältet ~u. Divergensen räknas bara ut i celler
som inneh˚aller fluid.
ui+1/2,j,k − ui−1/2,j,k vi,j+1/2,k − vi,j−1/2,k wi,j,k+1/2 − wi,j,k−1/2
+
+
(3.12)
(∇ · ~u)i,j,k ≈
∆h
∆h
∆h
Nästa steg a¨ r att diskritisera vänsterledet som blir följande
∆t 2
∆t −6pi,j,k + pi+1,j,k + pi,j+1,k + pi,j,k+1 + pi−1,j,k + pi,j−1,k + pi,j,k−1
− ∇ p~ =
ρ
ρ
∆h2
(3.13)
Den riktiga betydelsen av vänsterledet a¨ r att laplaceoperatorn beskriver växlingen mellan de
olika elementen i voxeln, som bearbetas, och dess grannar. Den kan a¨ ven skrivas i vektorform
vilket kommer behövas när Poissons ekvation ska lösas.
Högerledet uttryckt i vektorer:


pi,j,k
pi+1,j,k 


pi,j+1,k 


∆t
∆t
pi,j,k+1 
−6
1
1
1
1
1
1
(3.14)
− ∇2 p~ =


ρ
ρ∆h2
pi−1,j,k 


pi,j−1,k 
pi,j,k−1
Med högerledet och vänsterledet diskretiserade a˚ terst˚ar det att lösa Poissons ekvation (3.11)
och för det m˚aste a¨ ven den skrivas i vektorform/matrisform:
A~x = ~b
(3.15)
I det linjära systemet (3.15) a¨ r A = ∇2 , ~x = p~ och ~b = ∇ · ~u. Detta ger att ~x ska lösas ut, det
vill säga inversen till A ska hittas.
För att f˚a en inblick i vad som egentligen händer i ekvation 3.14 s˚a förklaras
detta med ett
exempel. Det intressanta i ekvationen a¨ r radvektorn −6 1 1 1 1 1 1 i ekvation (3.14),
som refererar till om en voxel och dess grannar inneh˚aller fluid, luft eller solid. Ettor betyder att
voxlarna inneh˚aller fluid eller solid och nollor om voxlarna inneh˚aller luft. Om en voxel utgörs
av en solid behövs ett uttryck (3.16) för att beräkna trycket i voxeln och samtidigt upprätth˚alla
Neumans villkor [11]. Om en voxel till höger a¨ r solid, f˚as trycket i denna voxel genom:
pi+1,j,k = pi,j,k +
ρ∆h
(ui+1/2,j,k − usolid )
∆t
(3.16)
Ekvation (3.16) ersätter d˚a pi+1,j,k i ekvation (3.14).
Ett 2D-exempel ser ut som följande:


pi,j
∆t −4 1 0 1 1 

ρ∆h2

10

pi,j
+ ρ∆h
(ui+1/2,j − usolid )

∆t

pi,j+1


pi−1,j
pi,j−1
(3.17)
Där pi+1,j a¨ r en solid och pi,j+1 a¨ r fylld med luft vilket representeras av en nolla i radvektorn.
Figur 3.2: Bild till exempel (3.17).
11
3.6
Divergensfrihet
Ett villkor, som a¨ r mycket viktigt när fluider som vatten simuleras, a¨ r att den ska vara inkompressibel.
Volymen ska med andra ord vara konstant hela tiden. Ett villkor som kanske ses som självklart
men som faktiskt inte a¨ r helt trivialt.
Divergens i ett vektorfält kan ses som flödet i en viss punkt. Om divergensen a¨ r positiv
¨ flödet mot punkten större a¨ n flödet
strömmar det ut mer fr˚an punkten a¨ n vad det kommer in. Ar
ut a¨ r divergensen negativ. Under simuleringen m˚aste det gälla att hela fluiden a¨ r divergensfri,
det vill säga, differensen mellan flödet in och ut a¨ r lika med noll.
P˚a grund av att det blir en hel del approximationer under simuleringen a¨ r det sv˚art att beh˚alla
en konstant volym p˚a fluiden. Ofta komprimeras den och det ser ut som att vätska försvinner
sp˚arlöst. Ett trick för att lösa detta problem att göra en direkt modifiering p˚a Poisson-ekvationen
under tryckberäkningarna [12]. Om fluidens volym approximativt kan mätas under varje tidpunkt,
genom att räkna hur m˚anga voxlar som har ett negativt värde, kan denna jämföras med volymen
vid initiering. Differensen kommer att ge hur mycket volym som saknas och denna differens
skalas med en konstant och används i divergensdelen i Poisson-ekvationen.
3.6.1
Dirichlets randvillkor
Anledningen till att en fluid inte kan strömma in i en solid a¨ r att soliden alltid kan motsätta
ett lika högt tryck mot fluiden som fluiden utgör p˚a den. Detta m˚aste s˚aklart a¨ ven gälla i
simuleringen om vattnet ska stanna kvar i akvariet. För att tillämpa detta används Dirichlets
randvillkor (3.18) [11], som säger att hastigheter i närliggande soliders motsatta normalriktning
m˚aste vara noll. Med andra ord, det f˚ar inte existera n˚agra vektorkomposanter, i hastighetsfältet,
som pekar in mot en solid.
Figur 3.3: Bild p˚a innan och efter Dirichlets randvillkor uppfyllts
När soliden i fr˚aga har en hastighet s˚a gäller:
~u · n
ˆ = ~usolid · n
ˆ
(3.18)
där n
ˆ a¨ r normalen till soliden, ~u a¨ r fluidens hastigheter och ~usolid a¨ r solidens hastighet. Eftersom
det här projektet endast innefattar simulering med stillast˚aende solider kan följande ekvation
allts˚a användas:
~u · n
ˆ=0
(3.19)
Det a¨ r o¨ nskvärt att Dirichlets randvillkor a¨ r uppfyllt under hela simuleringen. Därför körs
operationen flera g˚anger för varje bildruta, mellan de olika uträkningarna.
12
Kapitel 4
Level set-metoden
Level set-metoden handlar om att förklara fluidens form och position med implicita ytor. Det
här kapitlet förklarar endast de allra grundligaste stegen för att använda metoden.
4.1
Implicita ytor
Med hjälp av level set-metoden kan fluidens form hela tiden representeras som en implicit yta.
En implicit yta har bland annat den fördel att den inte kan skapa tvetydighet om var ytan a¨ r
genom att korsa sig själv. När tv˚a ytor o¨ verlappas sl˚as de ihop och bildar en ny yta. Avst˚andet
till fluidens yta ges genom ekvationerna (4.1) och (4.2):
Distansinne = {x(t) ∈ <2 : φ(x(t)) ≤ 0}
(4.1)
Distansute = {x(t) ∈ <2 : φ(x(t)) > 0}
(4.2)
Detta ger att närmsta avst˚andet φ till fluidens yta kan hittas oavsett position i rymden. Ett
negativt φ-värde betyder att punkten a¨ r inuti fluiden och ett positivt värde utanför. När φ a¨ r
exakt noll ligger punkten p˚a ytan.
4.2
β- och γ-band
Vid simulering a¨ r det endast intressant att veta var fluidens yta befinner sig. Därför behövs det
bara ett definierat level set i omgivningen av ytan. Ett β-band begränsar level setets utsträckning
utanför fluidens yta, där konstanten β avgör hur l˚ang denna utsträckning a¨ r. Beroende p˚a
integrationsmetod i advektionen (se avsnitt 4.3) krävs olika värden p˚a β. För ett vanligt Euler-steg
räcker det med att β har ett värde motsvarande 2 · ∆h. För att försäkra sig om att korrekta
derivator finns i β-bandet utvidgas level setet med ytterligare ett band, γ-bandet, som i regel a¨ r
smalt.
13
Figur 4.1: Allt inom den svarta gränsen a¨ r fluid. Det gröna fältet a¨ r β-band och det streckade
a¨ r γ-band.
4.3
Advektion
Enligt avsnitt 2.5 uppfylls CFL-tillst˚andet med valt tidssteg. Detta a¨ r viktigt för att level setet
inte ska kollapsa. För att propagera ytan i tiden utförs ett advektionssteg utifr˚an det divergensfria
hastighetsfältet med ett enkelt Euler-steg. Advektion utförs bara p˚a celler som ligger innanför
β-bandet.
φ(n + 1) − φ(n)
∂φ
≈
(4.3)
∂t
∆t
∂φ
= −~u · ∇φ
(4.4)
∂t
Gradienten till φ behövs allts˚a räknas ut och för det används ett ”upwind scheme”, som i en
dimension ser ut som:
(
φ+
if ux < 0
∂φ
x = (φi+1,j,k − φi,j,k )/∆x,
≈
(4.5)
−
∂x
φx = (φi1,j,k − φi−1,j,k )/∆x, if ux > 0
Detta säger att information endast färdas i hastighetsfältets riktning och derivator tas fram
genom att bara kolla p˚a skillnader där fluiden har befunnit sig.
14
4.4
Reinitiering
B˚ade Eulersteget och approximeringen av gradienten introducerar fel i φ(n + 1). Eftersom
advektionen dessutom endast utförs i punkter inom β-bandet (se figur 4.1) initieras ett nytt
β-band i varje iteration i fluidsimuleringen. Detta kan göras med en geometrisk metod [13],
som tar fram vilka punkter som ligger i närheten av ytan. Utifr˚an dessa punkter utvidgas level
setet iterativt tills hela β-bandet a¨ r fyllt. Därefter skapas a¨ ven ett nytt γ-band.
15
Kapitel 5
Resultat
5.1
Realtid
Resultatet blev en vattenliknande fluid i tre dimensioner. Fluiden liknar vatten, inte bara visuellt
utan ocks˚a rent beteendemässigt, vilket fortfarande a¨ r knepigt att uppn˚a med denna metod. Vad
som vanligtvis inträffar a¨ r att fluiden f˚ar en alldeles för hög viskositet och liknar mer glycerol
eller sirap. Eftersom metoden inte a¨ r partikelbaserad ges dock inga riktiga stänk-effekter, som
riktiga vattenrörelser brukar ge upphov till. Bild p˚a fluiden i realtid:
Figur 5.1: Resultat
16
5.2
Utrenderat
Bild p˚a hur fluiden ser ut när den f˚att renderas ut i 3Ds Max, med fysikaliskt korrekt hdri-belysning
och ray-tracing-metoden Mental ray:
Figur 5.2: Resultat
17
Kapitel 6
Avslutning
6.1
Diskussion
Fluidsimulering a¨ r minst sagt en komplicerad process. Det finns en hel del information att
hitta om level set-metoden, b˚ade välskrivna rapporter och hemsidor. Det knepiga och mest
motsträviga under resans g˚ang har dock varit att implementera allt p˚a datorns grafikkort. Det
blir ett helt annorlunda tänk när beräkningar ska parallelliseras och optimeras för att samma
funktion ska kunna ge olika resultat p˚a olika kärnor, värden ska sparas i texturer istället för
arrayer och s˚a vidare.
Ett kvarst˚aende problem a¨ r simuleringens alla approximationer. Numeriska fel, i följd av
diskretiseringarna, gör att det kommer att bli vissa ej helt korrekta beteenden hos fluiden,
bland annat volymförlusten. Det som begränsar hur fina beräkningar som kan göras a¨ r datorns
prestanda.
6.2
Vidare förbättringar
Det finns ett stort antal förbättringar, som kan göras med denna fluidsimulering, för att ge den
ett a¨ n mer vattenliknande beteende. Det finns a¨ ven a˚ tgärden som kan göra den mer fysikaliskt
korrekt.
Det första som kommer p˚a tanke a¨ r problemet med volymförluster. Sättet detta a¨ r löst p˚a
a¨ r ett mycket overkligt s˚adant. Att skapa volym ur ingenting genom att förstöra en fysikaliskt
korrekt ekvation a¨ r inte optimalt. Det a¨ r dock en simpel lösning som fungerar bra rent visuellt,
och i m˚anga fall handlar datagrafik bara om att n˚agonting ska se bra ut. Den här metoden skulle
inte vara acceptabel i forskningssammanhang.
När det handlar om att f˚a till effekter som stänk och separationer av fluiden blir man i princip
tvungen att bygga vidare p˚a arbetet med en metod som kallas FLIP (fluid-implicit partikel). Det
a¨ r en Eulerisk fluidlösare som använder partiklar för advektion. [14]
För varje kernel anropar CUDA tillräckligt m˚anga block s˚a att varje tr˚ad f˚ar enbart en cell
att arbeta p˚a. Det hade varit intressant att undersöka om det hade g˚att snabbare i realtid om varje
tr˚ad f˚att jobba med flera celler a˚ t g˚angen [15]. Styrkan i denna metod hade varit möjligheten
till att lagra värden i ”Shared Memory” vilket a¨ r ett minne som varje block delar mellan sig och
dessutom a¨ r betydligt snabbare a¨ n att läsa fr˚an textur och globalt minne [16].
Realtidsrenderingen lider tyvärr lite av artefakter som orsakats av cellstorleken, trots att
trilinjär interpolation använts. Det borde vara möjligt att innan varje rendering skapa en statisk
3D-textur av level setet, raycasta den och använda trikubisk interpolation av normaler vid ytan.
18
D˚a g˚ar det att använda grafikkortets egna process av filtrering (som a¨ r lika snabb som vanlig
texturläsning) och använda endast 8 texturläsningar istället för 64 som trikubisk interpolation
vanligtvis kräver [17].
19
Litteraturförteckning
[1] Osher S, Fedkiw R. Level Set methods and Dynamic Implicit Surfaces. Los Angeles:
Springer; 2003
[2] Bridson R. Fluid Simulation for Computer Graphics. s. 21-25. Wellesly: A K Peters; 2008
[3] Fedkiw R, Stam J, Jensen H. W. Visual Simulation of Smoke. Standford University. http:
//physbam.stanford.edu/˜fedkiw/papers/stanford2001-01.pdf;
Senast hämtad 2011-03-15
[4] Sanders J, Kandrot E. CUDA by Example - An Introduction to General-Purpose GPU
Programming. Boston: Addison-Wesley; 2010
[5] Bourke P. Polygonising a Scalar Field. 1994. http://paulbourke.net/
geometry/polygonise/; Senast hämtad 2011-03-08
[6] Hadwiger M, Sigg C, Scharsach H, Bühler K, Gross M. Real-TIme Ray-Casting and
Advanced Shading of Discrete Isosurfaces. Eurographics: M. Alexa, J. Marks; 2005
[7] Watt A. 3D Computer graphics. s. 171-183. Harlow: Pearson, Addison-Wesley; Third
edition 2010
[8] Crane K, Tariq S. Real-Time Simulation and Rendering of 3D-fluids. Nvidia. http://
http.developer.nvidia.com/GPUGems3/gpugems3_ch30.html; Senast
hämtad 2011-03-08
[9] Stam J. Stable Fluids. Alias Wavefront. http://www.dgp.toronto.edu/
people/stam/reality/Research/pdf/ns.pdf; Senast hämtad 2011-03-08
[10] Liu Y, Dupont T. F. Back and Forth Error Compensation and Correction Methods for
Removing Errors Induced by Uneven Gradients of the Level Set Function. s. 311–324. J.
Comput. Phys; 2003
[11] Läthén G, Nilsson O, Söderström A. Fluid Simulation. LiU, TNM079, Modeling and
Animation, Lab6; 2010
[12] Söderström A. Memory Efficient Methods for Eulerian Free Surface Fluid Animation.
Linköpings universitet, ITN; 2010
[13] Tsai Y.-H. R. Rapid and Accurate Computation of the Distance Function Using Grids. s.
175-195. J. Computing Physics; 2002
[14] Zhu Y, Bridson R. Animating Sand as Fluid. ACM Trans. Graph; 2005
20
[15] Brandvik T, Pullan G. Acceleration of a 3D Euler Solver Using Commodity Graphics
Hardware. Cambridge, University of Cambridge; 2008. http://www.eng.cam.ac.
uk/˜gp10006/research/Brandvik_Pullan_2008a_DRAFT.pdf;
Senast
hämtad 2011-03-13
[16] Nvidia. CUDA Programming Guide. 2008. http://developer.download.
nvidia.com/compute/cuda/2_0/docs/NVIDIA_CUDA_Programming_
Guide_2.0.pdf; Senast hämtad 2011-03-13
[17] Sigg C, Hadwiger C. Fast Third-Order Texture Filtering. Nvidia. http://http.
developer.nvidia.com/GPUGems2/gpugems2_chapter20.html; Senast
hämtad 2011-03-08

Simulering och visualisering av en Eulerisk fluid p˚a grafikkortet

Transcript Simulering och visualisering av en Eulerisk fluid p˚a grafikkortet

Directory