Merge pull request #17359 from hashicorp/jbardin/provisioner-error
Halt on provisioner errors
This commit is contained in:
commit
1c4f403386
|
@ -15,7 +15,6 @@ import (
|
||||||
"strings"
|
"strings"
|
||||||
"sync"
|
"sync"
|
||||||
"text/template"
|
"text/template"
|
||||||
"time"
|
|
||||||
|
|
||||||
"github.com/hashicorp/terraform/communicator"
|
"github.com/hashicorp/terraform/communicator"
|
||||||
"github.com/hashicorp/terraform/communicator/remote"
|
"github.com/hashicorp/terraform/communicator/remote"
|
||||||
|
@ -307,8 +306,11 @@ func applyFn(ctx context.Context) error {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
|
||||||
|
ctx, cancel := context.WithTimeout(ctx, comm.Timeout())
|
||||||
|
defer cancel()
|
||||||
|
|
||||||
// Wait and retry until we establish the connection
|
// Wait and retry until we establish the connection
|
||||||
err = retryFunc(comm.Timeout(), func() error {
|
err = communicator.Retry(ctx, func() error {
|
||||||
return comm.Connect(o)
|
return comm.Connect(o)
|
||||||
})
|
})
|
||||||
if err != nil {
|
if err != nil {
|
||||||
|
@ -717,24 +719,6 @@ func (p *provisioner) copyOutput(o terraform.UIOutput, r io.Reader, doneCh chan<
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
// retryFunc is used to retry a function for a given duration
|
|
||||||
func retryFunc(timeout time.Duration, f func() error) error {
|
|
||||||
finish := time.After(timeout)
|
|
||||||
for {
|
|
||||||
err := f()
|
|
||||||
if err == nil {
|
|
||||||
return nil
|
|
||||||
}
|
|
||||||
log.Printf("Retryable error: %v", err)
|
|
||||||
|
|
||||||
select {
|
|
||||||
case <-finish:
|
|
||||||
return err
|
|
||||||
case <-time.After(3 * time.Second):
|
|
||||||
}
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
func decodeConfig(d *schema.ResourceData) (*provisioner, error) {
|
func decodeConfig(d *schema.ResourceData) (*provisioner, error) {
|
||||||
p := &provisioner{
|
p := &provisioner{
|
||||||
ClientOptions: getStringList(d.Get("client_options")),
|
ClientOptions: getStringList(d.Get("client_options")),
|
||||||
|
|
|
@ -4,9 +4,7 @@ import (
|
||||||
"context"
|
"context"
|
||||||
"fmt"
|
"fmt"
|
||||||
"io/ioutil"
|
"io/ioutil"
|
||||||
"log"
|
|
||||||
"os"
|
"os"
|
||||||
"time"
|
|
||||||
|
|
||||||
"github.com/hashicorp/terraform/communicator"
|
"github.com/hashicorp/terraform/communicator"
|
||||||
"github.com/hashicorp/terraform/helper/schema"
|
"github.com/hashicorp/terraform/helper/schema"
|
||||||
|
@ -50,6 +48,9 @@ func applyFn(ctx context.Context) error {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
|
||||||
|
ctx, cancel := context.WithTimeout(ctx, comm.Timeout())
|
||||||
|
defer cancel()
|
||||||
|
|
||||||
// Get the source
|
// Get the source
|
||||||
src, deleteSource, err := getSrc(data)
|
src, deleteSource, err := getSrc(data)
|
||||||
if err != nil {
|
if err != nil {
|
||||||
|
@ -61,21 +62,11 @@ func applyFn(ctx context.Context) error {
|
||||||
|
|
||||||
// Begin the file copy
|
// Begin the file copy
|
||||||
dst := data.Get("destination").(string)
|
dst := data.Get("destination").(string)
|
||||||
resultCh := make(chan error, 1)
|
|
||||||
go func() {
|
|
||||||
resultCh <- copyFiles(comm, src, dst)
|
|
||||||
}()
|
|
||||||
|
|
||||||
// Allow the file copy to complete unless there is an interrupt.
|
if err := copyFiles(ctx, comm, src, dst); err != nil {
|
||||||
// If there is an interrupt we make no attempt to cleanly close
|
|
||||||
// the connection currently. We just abruptly exit. Because Terraform
|
|
||||||
// taints the resource, this is fine.
|
|
||||||
select {
|
|
||||||
case err := <-resultCh:
|
|
||||||
return err
|
return err
|
||||||
case <-ctx.Done():
|
|
||||||
return fmt.Errorf("file transfer interrupted")
|
|
||||||
}
|
}
|
||||||
|
return nil
|
||||||
}
|
}
|
||||||
|
|
||||||
func validateFn(c *terraform.ResourceConfig) (ws []string, es []error) {
|
func validateFn(c *terraform.ResourceConfig) (ws []string, es []error) {
|
||||||
|
@ -107,16 +98,21 @@ func getSrc(data *schema.ResourceData) (string, bool, error) {
|
||||||
}
|
}
|
||||||
|
|
||||||
// copyFiles is used to copy the files from a source to a destination
|
// copyFiles is used to copy the files from a source to a destination
|
||||||
func copyFiles(comm communicator.Communicator, src, dst string) error {
|
func copyFiles(ctx context.Context, comm communicator.Communicator, src, dst string) error {
|
||||||
// Wait and retry until we establish the connection
|
// Wait and retry until we establish the connection
|
||||||
err := retryFunc(comm.Timeout(), func() error {
|
err := communicator.Retry(ctx, func() error {
|
||||||
err := comm.Connect(nil)
|
return comm.Connect(nil)
|
||||||
return err
|
|
||||||
})
|
})
|
||||||
if err != nil {
|
if err != nil {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
defer comm.Disconnect()
|
|
||||||
|
// disconnect when the context is canceled, which will close this after
|
||||||
|
// Apply as well.
|
||||||
|
go func() {
|
||||||
|
<-ctx.Done()
|
||||||
|
comm.Disconnect()
|
||||||
|
}()
|
||||||
|
|
||||||
info, err := os.Stat(src)
|
info, err := os.Stat(src)
|
||||||
if err != nil {
|
if err != nil {
|
||||||
|
@ -144,21 +140,3 @@ func copyFiles(comm communicator.Communicator, src, dst string) error {
|
||||||
}
|
}
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
|
||||||
// retryFunc is used to retry a function for a given duration
|
|
||||||
func retryFunc(timeout time.Duration, f func() error) error {
|
|
||||||
finish := time.After(timeout)
|
|
||||||
for {
|
|
||||||
err := f()
|
|
||||||
if err == nil {
|
|
||||||
return nil
|
|
||||||
}
|
|
||||||
log.Printf("Retryable error: %v", err)
|
|
||||||
|
|
||||||
select {
|
|
||||||
case <-finish:
|
|
||||||
return err
|
|
||||||
case <-time.After(3 * time.Second):
|
|
||||||
}
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
|
@ -6,12 +6,10 @@ import (
|
||||||
"errors"
|
"errors"
|
||||||
"fmt"
|
"fmt"
|
||||||
"io"
|
"io"
|
||||||
"log"
|
|
||||||
"net/url"
|
"net/url"
|
||||||
"path"
|
"path"
|
||||||
"strings"
|
"strings"
|
||||||
"text/template"
|
"text/template"
|
||||||
"time"
|
|
||||||
|
|
||||||
"github.com/hashicorp/terraform/communicator"
|
"github.com/hashicorp/terraform/communicator"
|
||||||
"github.com/hashicorp/terraform/communicator/remote"
|
"github.com/hashicorp/terraform/communicator/remote"
|
||||||
|
@ -233,10 +231,13 @@ func applyFn(ctx context.Context) error {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
|
||||||
err = retryFunc(comm.Timeout(), func() error {
|
ctx, cancel := context.WithTimeout(ctx, comm.Timeout())
|
||||||
err = comm.Connect(o)
|
defer cancel()
|
||||||
return err
|
|
||||||
|
err = communicator.Retry(ctx, func() error {
|
||||||
|
return comm.Connect(o)
|
||||||
})
|
})
|
||||||
|
|
||||||
if err != nil {
|
if err != nil {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
@ -728,24 +729,6 @@ func (p *provisioner) uploadUserTOML(o terraform.UIOutput, comm communicator.Com
|
||||||
|
|
||||||
}
|
}
|
||||||
|
|
||||||
func retryFunc(timeout time.Duration, f func() error) error {
|
|
||||||
finish := time.After(timeout)
|
|
||||||
|
|
||||||
for {
|
|
||||||
err := f()
|
|
||||||
if err == nil {
|
|
||||||
return nil
|
|
||||||
}
|
|
||||||
log.Printf("Retryable error: %v", err)
|
|
||||||
|
|
||||||
select {
|
|
||||||
case <-finish:
|
|
||||||
return err
|
|
||||||
case <-time.After(3 * time.Second):
|
|
||||||
}
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p *provisioner) copyOutput(o terraform.UIOutput, r io.Reader, doneCh chan<- struct{}) {
|
func (p *provisioner) copyOutput(o terraform.UIOutput, r io.Reader, doneCh chan<- struct{}) {
|
||||||
defer close(doneCh)
|
defer close(doneCh)
|
||||||
lr := linereader.New(r)
|
lr := linereader.New(r)
|
||||||
|
|
|
@ -9,7 +9,6 @@ import (
|
||||||
"log"
|
"log"
|
||||||
"os"
|
"os"
|
||||||
"strings"
|
"strings"
|
||||||
"sync/atomic"
|
|
||||||
"time"
|
"time"
|
||||||
|
|
||||||
"github.com/hashicorp/terraform/communicator"
|
"github.com/hashicorp/terraform/communicator"
|
||||||
|
@ -159,7 +158,7 @@ func runScripts(
|
||||||
scripts []io.ReadCloser) error {
|
scripts []io.ReadCloser) error {
|
||||||
// Wrap out context in a cancelation function that we use to
|
// Wrap out context in a cancelation function that we use to
|
||||||
// kill the connection.
|
// kill the connection.
|
||||||
ctx, cancelFunc := context.WithCancel(ctx)
|
ctx, cancelFunc := context.WithTimeout(ctx, comm.Timeout())
|
||||||
defer cancelFunc()
|
defer cancelFunc()
|
||||||
|
|
||||||
// Wait for the context to end and then disconnect
|
// Wait for the context to end and then disconnect
|
||||||
|
@ -169,9 +168,8 @@ func runScripts(
|
||||||
}()
|
}()
|
||||||
|
|
||||||
// Wait and retry until we establish the connection
|
// Wait and retry until we establish the connection
|
||||||
err := retryFunc(ctx, comm.Timeout(), func() error {
|
err := communicator.Retry(ctx, func() error {
|
||||||
err := comm.Connect(o)
|
return comm.Connect(o)
|
||||||
return err
|
|
||||||
})
|
})
|
||||||
if err != nil {
|
if err != nil {
|
||||||
return err
|
return err
|
||||||
|
@ -179,49 +177,34 @@ func runScripts(
|
||||||
|
|
||||||
for _, script := range scripts {
|
for _, script := range scripts {
|
||||||
var cmd *remote.Cmd
|
var cmd *remote.Cmd
|
||||||
|
|
||||||
outR, outW := io.Pipe()
|
outR, outW := io.Pipe()
|
||||||
errR, errW := io.Pipe()
|
errR, errW := io.Pipe()
|
||||||
outDoneCh := make(chan struct{})
|
defer outW.Close()
|
||||||
errDoneCh := make(chan struct{})
|
defer errW.Close()
|
||||||
go copyOutput(o, outR, outDoneCh)
|
|
||||||
go copyOutput(o, errR, errDoneCh)
|
go copyOutput(o, outR)
|
||||||
|
go copyOutput(o, errR)
|
||||||
|
|
||||||
remotePath := comm.ScriptPath()
|
remotePath := comm.ScriptPath()
|
||||||
err = retryFunc(ctx, comm.Timeout(), func() error {
|
|
||||||
if err := comm.UploadScript(remotePath, script); err != nil {
|
|
||||||
return fmt.Errorf("Failed to upload script: %v", err)
|
|
||||||
}
|
|
||||||
|
|
||||||
cmd = &remote.Cmd{
|
if err := comm.UploadScript(remotePath, script); err != nil {
|
||||||
Command: remotePath,
|
return fmt.Errorf("Failed to upload script: %v", err)
|
||||||
Stdout: outW,
|
|
||||||
Stderr: errW,
|
|
||||||
}
|
|
||||||
if err := comm.Start(cmd); err != nil {
|
|
||||||
return fmt.Errorf("Error starting script: %v", err)
|
|
||||||
}
|
|
||||||
|
|
||||||
return nil
|
|
||||||
})
|
|
||||||
if err == nil {
|
|
||||||
cmd.Wait()
|
|
||||||
if cmd.ExitStatus != 0 {
|
|
||||||
err = fmt.Errorf("Script exited with non-zero exit status: %d", cmd.ExitStatus)
|
|
||||||
}
|
|
||||||
}
|
}
|
||||||
|
|
||||||
// If we have an error, end our context so the disconnect happens.
|
cmd = &remote.Cmd{
|
||||||
// This has to happen before the output cleanup below since during
|
Command: remotePath,
|
||||||
// an interrupt this will cause the outputs to end.
|
Stdout: outW,
|
||||||
if err != nil {
|
Stderr: errW,
|
||||||
cancelFunc()
|
}
|
||||||
|
if err := comm.Start(cmd); err != nil {
|
||||||
|
return fmt.Errorf("Error starting script: %v", err)
|
||||||
}
|
}
|
||||||
|
|
||||||
// Wait for output to clean up
|
cmd.Wait()
|
||||||
outW.Close()
|
if cmd.ExitStatus != 0 {
|
||||||
errW.Close()
|
err = fmt.Errorf("Script exited with non-zero exit status: %d", cmd.ExitStatus)
|
||||||
<-outDoneCh
|
}
|
||||||
<-errDoneCh
|
|
||||||
|
|
||||||
// Upload a blank follow up file in the same path to prevent residual
|
// Upload a blank follow up file in the same path to prevent residual
|
||||||
// script contents from remaining on remote machine
|
// script contents from remaining on remote machine
|
||||||
|
@ -230,93 +213,15 @@ func runScripts(
|
||||||
// This feature is best-effort.
|
// This feature is best-effort.
|
||||||
log.Printf("[WARN] Failed to upload empty follow up script: %v", err)
|
log.Printf("[WARN] Failed to upload empty follow up script: %v", err)
|
||||||
}
|
}
|
||||||
|
|
||||||
// If we have an error, return it out now that we've cleaned up
|
|
||||||
if err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
}
|
}
|
||||||
|
|
||||||
return nil
|
return nil
|
||||||
}
|
}
|
||||||
|
|
||||||
func copyOutput(
|
func copyOutput(
|
||||||
o terraform.UIOutput, r io.Reader, doneCh chan<- struct{}) {
|
o terraform.UIOutput, r io.Reader) {
|
||||||
defer close(doneCh)
|
|
||||||
lr := linereader.New(r)
|
lr := linereader.New(r)
|
||||||
for line := range lr.Ch {
|
for line := range lr.Ch {
|
||||||
o.Output(line)
|
o.Output(line)
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
// retryFunc is used to retry a function for a given duration
|
|
||||||
func retryFunc(ctx context.Context, timeout time.Duration, f func() error) error {
|
|
||||||
// Build a new context with the timeout
|
|
||||||
ctx, done := context.WithTimeout(ctx, timeout)
|
|
||||||
defer done()
|
|
||||||
|
|
||||||
// container for atomic error value
|
|
||||||
type errWrap struct {
|
|
||||||
E error
|
|
||||||
}
|
|
||||||
|
|
||||||
// Try the function in a goroutine
|
|
||||||
var errVal atomic.Value
|
|
||||||
doneCh := make(chan struct{})
|
|
||||||
go func() {
|
|
||||||
defer close(doneCh)
|
|
||||||
|
|
||||||
delay := time.Duration(0)
|
|
||||||
for {
|
|
||||||
// If our context ended, we want to exit right away.
|
|
||||||
select {
|
|
||||||
case <-ctx.Done():
|
|
||||||
return
|
|
||||||
case <-time.After(delay):
|
|
||||||
}
|
|
||||||
|
|
||||||
// Try the function call
|
|
||||||
err := f()
|
|
||||||
errVal.Store(&errWrap{err})
|
|
||||||
|
|
||||||
if err == nil {
|
|
||||||
return
|
|
||||||
}
|
|
||||||
|
|
||||||
log.Printf("[WARN] retryable error: %v", err)
|
|
||||||
|
|
||||||
delay *= 2
|
|
||||||
|
|
||||||
if delay == 0 {
|
|
||||||
delay = initialBackoffDelay
|
|
||||||
}
|
|
||||||
|
|
||||||
if delay > maxBackoffDelay {
|
|
||||||
delay = maxBackoffDelay
|
|
||||||
}
|
|
||||||
|
|
||||||
log.Printf("[INFO] sleeping for %s", delay)
|
|
||||||
}
|
|
||||||
}()
|
|
||||||
|
|
||||||
// Wait for completion
|
|
||||||
select {
|
|
||||||
case <-ctx.Done():
|
|
||||||
case <-doneCh:
|
|
||||||
}
|
|
||||||
|
|
||||||
// Check if we have a context error to check if we're interrupted or timeout
|
|
||||||
switch ctx.Err() {
|
|
||||||
case context.Canceled:
|
|
||||||
return fmt.Errorf("interrupted")
|
|
||||||
case context.DeadlineExceeded:
|
|
||||||
return fmt.Errorf("timeout")
|
|
||||||
}
|
|
||||||
|
|
||||||
// Check if we got an error executing
|
|
||||||
if ev, ok := errVal.Load().(errWrap); ok {
|
|
||||||
return ev.E
|
|
||||||
}
|
|
||||||
|
|
||||||
return nil
|
|
||||||
}
|
|
||||||
|
|
|
@ -2,12 +2,8 @@ package remoteexec
|
||||||
|
|
||||||
import (
|
import (
|
||||||
"bytes"
|
"bytes"
|
||||||
"context"
|
|
||||||
"errors"
|
|
||||||
"io"
|
"io"
|
||||||
"net"
|
|
||||||
"testing"
|
"testing"
|
||||||
"time"
|
|
||||||
|
|
||||||
"strings"
|
"strings"
|
||||||
|
|
||||||
|
@ -210,64 +206,6 @@ func TestResourceProvider_CollectScripts_scriptsEmpty(t *testing.T) {
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
func TestRetryFunc(t *testing.T) {
|
|
||||||
origMax := maxBackoffDelay
|
|
||||||
maxBackoffDelay = time.Second
|
|
||||||
origStart := initialBackoffDelay
|
|
||||||
initialBackoffDelay = 10 * time.Millisecond
|
|
||||||
|
|
||||||
defer func() {
|
|
||||||
maxBackoffDelay = origMax
|
|
||||||
initialBackoffDelay = origStart
|
|
||||||
}()
|
|
||||||
|
|
||||||
// succeed on the third try
|
|
||||||
errs := []error{io.EOF, &net.OpError{Err: errors.New("ERROR")}, nil}
|
|
||||||
count := 0
|
|
||||||
|
|
||||||
err := retryFunc(context.Background(), time.Second, func() error {
|
|
||||||
if count >= len(errs) {
|
|
||||||
return errors.New("failed to stop after nil error")
|
|
||||||
}
|
|
||||||
|
|
||||||
err := errs[count]
|
|
||||||
count++
|
|
||||||
|
|
||||||
return err
|
|
||||||
})
|
|
||||||
|
|
||||||
if count != 3 {
|
|
||||||
t.Fatal("retry func should have been called 3 times")
|
|
||||||
}
|
|
||||||
|
|
||||||
if err != nil {
|
|
||||||
t.Fatal(err)
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
func TestRetryFuncBackoff(t *testing.T) {
|
|
||||||
origMax := maxBackoffDelay
|
|
||||||
maxBackoffDelay = time.Second
|
|
||||||
origStart := initialBackoffDelay
|
|
||||||
initialBackoffDelay = 100 * time.Millisecond
|
|
||||||
|
|
||||||
defer func() {
|
|
||||||
maxBackoffDelay = origMax
|
|
||||||
initialBackoffDelay = origStart
|
|
||||||
}()
|
|
||||||
|
|
||||||
count := 0
|
|
||||||
|
|
||||||
retryFunc(context.Background(), time.Second, func() error {
|
|
||||||
count++
|
|
||||||
return io.EOF
|
|
||||||
})
|
|
||||||
|
|
||||||
if count > 4 {
|
|
||||||
t.Fatalf("retry func failed to backoff. called %d times", count)
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
func testConfig(t *testing.T, c map[string]interface{}) *terraform.ResourceConfig {
|
func testConfig(t *testing.T, c map[string]interface{}) *terraform.ResourceConfig {
|
||||||
r, err := config.NewRawConfig(c)
|
r, err := config.NewRawConfig(c)
|
||||||
if err != nil {
|
if err != nil {
|
||||||
|
|
|
@ -1,8 +1,11 @@
|
||||||
package communicator
|
package communicator
|
||||||
|
|
||||||
import (
|
import (
|
||||||
|
"context"
|
||||||
"fmt"
|
"fmt"
|
||||||
"io"
|
"io"
|
||||||
|
"log"
|
||||||
|
"sync/atomic"
|
||||||
"time"
|
"time"
|
||||||
|
|
||||||
"github.com/hashicorp/terraform/communicator/remote"
|
"github.com/hashicorp/terraform/communicator/remote"
|
||||||
|
@ -51,3 +54,96 @@ func New(s *terraform.InstanceState) (Communicator, error) {
|
||||||
return nil, fmt.Errorf("connection type '%s' not supported", connType)
|
return nil, fmt.Errorf("connection type '%s' not supported", connType)
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
// maxBackoffDelay is the maximum delay between retry attempts
|
||||||
|
var maxBackoffDelay = 20 * time.Second
|
||||||
|
var initialBackoffDelay = time.Second
|
||||||
|
|
||||||
|
// Fatal is an interface that error values can return to halt Retry
|
||||||
|
type Fatal interface {
|
||||||
|
FatalError() error
|
||||||
|
}
|
||||||
|
|
||||||
|
// Retry retries the function f until it returns a nil error, a Fatal error, or
|
||||||
|
// the context expires.
|
||||||
|
func Retry(ctx context.Context, f func() error) error {
|
||||||
|
// container for atomic error value
|
||||||
|
type errWrap struct {
|
||||||
|
E error
|
||||||
|
}
|
||||||
|
|
||||||
|
// Try the function in a goroutine
|
||||||
|
var errVal atomic.Value
|
||||||
|
doneCh := make(chan struct{})
|
||||||
|
go func() {
|
||||||
|
defer close(doneCh)
|
||||||
|
|
||||||
|
delay := time.Duration(0)
|
||||||
|
for {
|
||||||
|
// If our context ended, we want to exit right away.
|
||||||
|
select {
|
||||||
|
case <-ctx.Done():
|
||||||
|
return
|
||||||
|
case <-time.After(delay):
|
||||||
|
}
|
||||||
|
|
||||||
|
// Try the function call
|
||||||
|
err := f()
|
||||||
|
|
||||||
|
// return if we have no error, or a FatalError
|
||||||
|
done := false
|
||||||
|
switch e := err.(type) {
|
||||||
|
case nil:
|
||||||
|
done = true
|
||||||
|
case Fatal:
|
||||||
|
err = e.FatalError()
|
||||||
|
done = true
|
||||||
|
}
|
||||||
|
|
||||||
|
errVal.Store(errWrap{err})
|
||||||
|
|
||||||
|
if done {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
log.Printf("[WARN] retryable error: %v", err)
|
||||||
|
|
||||||
|
delay *= 2
|
||||||
|
|
||||||
|
if delay == 0 {
|
||||||
|
delay = initialBackoffDelay
|
||||||
|
}
|
||||||
|
|
||||||
|
if delay > maxBackoffDelay {
|
||||||
|
delay = maxBackoffDelay
|
||||||
|
}
|
||||||
|
|
||||||
|
log.Printf("[INFO] sleeping for %s", delay)
|
||||||
|
}
|
||||||
|
}()
|
||||||
|
|
||||||
|
// Wait for completion
|
||||||
|
select {
|
||||||
|
case <-ctx.Done():
|
||||||
|
case <-doneCh:
|
||||||
|
}
|
||||||
|
|
||||||
|
var lastErr error
|
||||||
|
// Check if we got an error executing
|
||||||
|
if ev, ok := errVal.Load().(errWrap); ok {
|
||||||
|
lastErr = ev.E
|
||||||
|
}
|
||||||
|
|
||||||
|
// Check if we have a context error to check if we're interrupted or timeout
|
||||||
|
switch ctx.Err() {
|
||||||
|
case context.Canceled:
|
||||||
|
return fmt.Errorf("interrupted - last error: %v", lastErr)
|
||||||
|
case context.DeadlineExceeded:
|
||||||
|
return fmt.Errorf("timeout - last error: %v", lastErr)
|
||||||
|
}
|
||||||
|
|
||||||
|
if lastErr != nil {
|
||||||
|
return lastErr
|
||||||
|
}
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
|
@ -1,7 +1,12 @@
|
||||||
package communicator
|
package communicator
|
||||||
|
|
||||||
import (
|
import (
|
||||||
|
"context"
|
||||||
|
"errors"
|
||||||
|
"io"
|
||||||
|
"net"
|
||||||
"testing"
|
"testing"
|
||||||
|
"time"
|
||||||
|
|
||||||
"github.com/hashicorp/terraform/terraform"
|
"github.com/hashicorp/terraform/terraform"
|
||||||
)
|
)
|
||||||
|
@ -28,3 +33,66 @@ func TestCommunicator_new(t *testing.T) {
|
||||||
t.Fatalf("err: %v", err)
|
t.Fatalf("err: %v", err)
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
func TestRetryFunc(t *testing.T) {
|
||||||
|
origMax := maxBackoffDelay
|
||||||
|
maxBackoffDelay = time.Second
|
||||||
|
origStart := initialBackoffDelay
|
||||||
|
initialBackoffDelay = 10 * time.Millisecond
|
||||||
|
|
||||||
|
defer func() {
|
||||||
|
maxBackoffDelay = origMax
|
||||||
|
initialBackoffDelay = origStart
|
||||||
|
}()
|
||||||
|
|
||||||
|
// succeed on the third try
|
||||||
|
errs := []error{io.EOF, &net.OpError{Err: errors.New("ERROR")}, nil}
|
||||||
|
count := 0
|
||||||
|
|
||||||
|
ctx, cancel := context.WithTimeout(context.Background(), time.Second)
|
||||||
|
defer cancel()
|
||||||
|
|
||||||
|
err := Retry(ctx, func() error {
|
||||||
|
if count >= len(errs) {
|
||||||
|
return errors.New("failed to stop after nil error")
|
||||||
|
}
|
||||||
|
|
||||||
|
err := errs[count]
|
||||||
|
count++
|
||||||
|
|
||||||
|
return err
|
||||||
|
})
|
||||||
|
|
||||||
|
if count != 3 {
|
||||||
|
t.Fatal("retry func should have been called 3 times")
|
||||||
|
}
|
||||||
|
|
||||||
|
if err != nil {
|
||||||
|
t.Fatal(err)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
func TestRetryFuncBackoff(t *testing.T) {
|
||||||
|
origMax := maxBackoffDelay
|
||||||
|
maxBackoffDelay = time.Second
|
||||||
|
origStart := initialBackoffDelay
|
||||||
|
initialBackoffDelay = 100 * time.Millisecond
|
||||||
|
|
||||||
|
defer func() {
|
||||||
|
maxBackoffDelay = origMax
|
||||||
|
initialBackoffDelay = origStart
|
||||||
|
}()
|
||||||
|
|
||||||
|
count := 0
|
||||||
|
|
||||||
|
ctx, cancel := context.WithTimeout(context.Background(), time.Second)
|
||||||
|
defer cancel()
|
||||||
|
|
||||||
|
Retry(ctx, func() error {
|
||||||
|
count++
|
||||||
|
return io.EOF
|
||||||
|
})
|
||||||
|
|
||||||
|
if count > 4 {
|
||||||
|
t.Fatalf("retry func failed to backoff. called %d times", count)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
|
@ -63,6 +63,14 @@ type sshConfig struct {
|
||||||
sshAgent *sshAgent
|
sshAgent *sshAgent
|
||||||
}
|
}
|
||||||
|
|
||||||
|
type fatalError struct {
|
||||||
|
error
|
||||||
|
}
|
||||||
|
|
||||||
|
func (e fatalError) FatalError() error {
|
||||||
|
return e.error
|
||||||
|
}
|
||||||
|
|
||||||
// New creates a new communicator implementation over SSH.
|
// New creates a new communicator implementation over SSH.
|
||||||
func New(s *terraform.InstanceState) (*Communicator, error) {
|
func New(s *terraform.InstanceState) (*Communicator, error) {
|
||||||
connInfo, err := parseConnectionInfo(s)
|
connInfo, err := parseConnectionInfo(s)
|
||||||
|
@ -159,8 +167,8 @@ func (c *Communicator) Connect(o terraform.UIOutput) (err error) {
|
||||||
host := fmt.Sprintf("%s:%d", c.connInfo.Host, c.connInfo.Port)
|
host := fmt.Sprintf("%s:%d", c.connInfo.Host, c.connInfo.Port)
|
||||||
sshConn, sshChan, req, err := ssh.NewClientConn(c.conn, host, c.config.config)
|
sshConn, sshChan, req, err := ssh.NewClientConn(c.conn, host, c.config.config)
|
||||||
if err != nil {
|
if err != nil {
|
||||||
log.Printf("handshake error: %s", err)
|
log.Printf("fatal handshake error: %s", err)
|
||||||
return err
|
return fatalError{err}
|
||||||
}
|
}
|
||||||
|
|
||||||
c.client = ssh.NewClient(sshConn, sshChan, req)
|
c.client = ssh.NewClient(sshConn, sshChan, req)
|
||||||
|
@ -168,7 +176,7 @@ func (c *Communicator) Connect(o terraform.UIOutput) (err error) {
|
||||||
if c.config.sshAgent != nil {
|
if c.config.sshAgent != nil {
|
||||||
log.Printf("[DEBUG] Telling SSH config to forward to agent")
|
log.Printf("[DEBUG] Telling SSH config to forward to agent")
|
||||||
if err := c.config.sshAgent.ForwardToAgent(c.client); err != nil {
|
if err := c.config.sshAgent.ForwardToAgent(c.client); err != nil {
|
||||||
return err
|
return fatalError{err}
|
||||||
}
|
}
|
||||||
|
|
||||||
log.Printf("[DEBUG] Setting up a session to request agent forwarding")
|
log.Printf("[DEBUG] Setting up a session to request agent forwarding")
|
||||||
|
|
Loading…
Reference in New Issue